50 美元成功訓練 AI 模型挑戰 DeepSeek AI 教母李飛飛蒸餾他人模型根本不花錢

253 回覆
62 Like 81 Dislike
2025-02-10 16:01:29
我信Alex Wang

DeepSeek offline 版可以用
2025-02-10 16:02:05
半年之後財報可能爆雷,有賺好走小小。
2025-02-10 16:03:42
? ching 1999
可唔可以elaborate
2025-02-10 16:05:31
咁皮褸黃算甚麼?
2025-02-10 16:07:55
係可能,當MoE 設計良好
利用不同領域專家更有效
呢一點係要讚DeepSeek
2025-02-10 16:09:23
迴力鏢
2025-02-10 16:11:42
reddit有人分析過o3好似hide左
變summarize既推理過程
變相點問都冇用
2025-02-10 16:11:48
呢個強項黎 由新伯倫 瑞幸咖啡 到 百度 小紅書 byd c919 抄人永遠最低成平(唔犯法罰錢既話)
2025-02-10 16:13:52
再講落去都無咩價值 已經知你唔係subject matter expert只係個9upper
其實點解死要支持用distillation呢隻字?
paper明明無提過r1 post-training有做distillation
真係OpenAI求其accuse完Deepseek偷data你地就上咗癮用buzzword?
2025-02-10 16:15:35
如果OpenAI, meta, google唔再有新模型出,佢個模型應該就唔會再有乜進步

李飛飛係咪俾x炒左?
2025-02-10 16:19:30
我用緊o3mini 同high
都有寫過程出嚟
同埋追問係無得hide
除非當晒敏感字全部唔答
2025-02-10 16:21:00
2025-02-10 16:21:28
蒸餾技術即係戰機引擎同客機引擎分別
大家都飛到
2025-02-10 16:22:52
首先deepseek係generative pre-trained transformer無錯架wor
另外如果你係想佢deepseek claim自己係嚟自OpenAI
claude同gemini夠有啦 日經
OpenAI飲到頭啖湯就係咁架啦
2025-02-10 16:25:04
啱唔晒又錯唔晒
openai set data唔係公海啲data嚟
做好咗filtering 同labeling 個data quality 差好遠
已經係openai自家嘅product嚟

唔能夠話同偷公海data嚟用無分別
姐係餐廳偷隻牛返嚟定偷啲牛扒返嚟
要班廚自己劏埋牛再開料成本一定高
去偷牛扒直接得返煎嘅過程咁一定平

而r1 s1都係要依靠呢啲優質嘅data 先可以train出嚟
無呢set嘢train出嚟都只係垃圾
2025-02-10 16:25:49
你都係答唔到openai得把口無實則咩證明
同時openai自己本身一樣有爭議佢都有所謂既抄人
50你又知唔知係咩黎,只講training
之前有人話30都搞掂添

Now, AI researchers at the University of California, Berkeley, claim to have replicated the R1 model for under $30

李飛飛呢單都成個星期前咁滯,都炒唔起話題,你估係咪你覺得咁開心大發現
2025-02-10 16:27:40
留名
2025-02-10 16:29:10
佢唔得
因為明顯為反而反
人講佢講9up反
2025-02-10 16:33:14
就咁睇好似純粹係將個AI Model 加返個reasoning,依家普通人都可以做到https://www.youtube.com/watch?v=aNisiIo1xBY
2025-02-10 16:35:54
有D似回到十幾年前WINDOWS VS LINUX
2025-02-10 16:36:55
如果做到手機行到, 對各類研究好大助力
2025-02-10 16:37:58
s1個底係qwen2.5 32B 應該有啲難
2025-02-10 16:39:25
即係蒸餾技術開啟左一條reverse engineering既渠道。任何人只要有access to OpenAI或者其他成熟模型, 都可以通過蒸餾技術複製~90%能力可比既clone。然後Deepseek再通過MoE技術,將呢個clone既性能優化,某啲功能上跑贏GPT或其他大模型。
2025-02-10 16:40:05
而家反而係第一個出最多力但要食屎,最後一個唔洗出力食九大簋
2025-02-10 16:43:06
OpenAI 唔一定全部都係優質data, o1 嘅數學同coding 都輸比 Deepseek, Deepseek 可以將所有開源同閉源平台嘅AI model 學習同改良,只係大家只focus 係OpenAI model 上

無OpenAI都可以用其他AI model, 只係當時競爭對手只有OpenAI 可比媲,而家阿里巴巴嘅千義通問等等都可以同R1 o1比較高下
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞