50 美元成功訓練 AI 模型挑戰 DeepSeek AI 教母李飛飛蒸餾他人模型根本不花錢

甜妹號 2025-02-10 16:01:29

我信Alex Wang

DeepSeek offline 版可以用

DBAA 2025-02-10 16:02:05

半年之後財報可能爆雷，有賺好走小小。

いのり 2025-02-10 16:03:42

? ching 1999

可唔可以elaborate

唉又係A餐呀 2025-02-10 16:05:31

咁皮褸黃算甚麼？

甜妹號 2025-02-10 16:07:55

係可能，當MoE 設計良好
利用不同領域專家更有效
呢一點係要讚DeepSeek

路姆閪 2025-02-10 16:09:23

迴力鏢

薑汁汽水 2025-02-10 16:11:42

reddit有人分析過o3好似hide左
變summarize既推理過程
變相點問都冇用

俊桃丸鳴 2025-02-10 16:11:48

呢個強項黎由新伯倫瑞幸咖啡到百度小紅書 byd c919 抄人永遠最低成平（唔犯法罰錢既話)

いのり 2025-02-10 16:13:52

再講落去都無咩價值已經知你唔係subject matter expert只係個9upper

其實點解死要支持用distillation呢隻字?

paper明明無提過r1 post-training有做distillation
真係OpenAI求其accuse完Deepseek偷data你地就上咗癮用buzzword?

誠哥的繼承者們 2025-02-10 16:15:35

如果OpenAI, meta, google唔再有新模型出，佢個模型應該就唔會再有乜進步

李飛飛係咪俾x炒左？

革命界KOL毛澤東 2025-02-10 16:19:30

我用緊o3mini 同high
都有寫過程出嚟
同埋追問係無得hide
除非當晒敏感字全部唔答

印鈔機CEO 2025-02-10 16:21:00

邊個用左個名 2025-02-10 16:21:28

蒸餾技術即係戰機引擎同客機引擎分別
大家都飛到

いのり 2025-02-10 16:22:52

首先deepseek係generative pre-trained transformer無錯架wor

另外如果你係想佢deepseek claim自己係嚟自OpenAI
claude同gemini夠有啦日經

OpenAI飲到頭啖湯就係咁架啦

革命界KOL毛澤東 2025-02-10 16:25:04

啱唔晒又錯唔晒
openai set data唔係公海啲data嚟
做好咗filtering 同labeling 個data quality 差好遠
已經係openai自家嘅product嚟

唔能夠話同偷公海data嚟用無分別
姐係餐廳偷隻牛返嚟定偷啲牛扒返嚟
要班廚自己劏埋牛再開料成本一定高
去偷牛扒直接得返煎嘅過程咁一定平

而r1 s1都係要依靠呢啲優質嘅data 先可以train出嚟
無呢set嘢train出嚟都只係垃圾

Ysamliu 2025-02-10 16:25:49

你都係答唔到openai得把口無實則咩證明
同時openai自己本身一樣有爭議佢都有所謂既抄人

50你又知唔知係咩黎，只講training
之前有人話30都搞掂添

Now, AI researchers at the University of California, Berkeley, claim to have replicated the R1 model for under $30

李飛飛呢單都成個星期前咁滯，都炒唔起話題，你估係咪你覺得咁開心大發現

港女洋腸夢 2025-02-10 16:27:40

留名

Ysamliu 2025-02-10 16:29:10

佢唔得
因為明顯為反而反
人講佢講9up反

港女洋腸夢 2025-02-10 16:33:14

就咁睇好似純粹係將個AI Model 加返個reasoning，依家普通人都可以做到https://www.youtube.com/watch?v=aNisiIo1xBY

兒登冧巴溫 2025-02-10 16:35:54

有D似回到十幾年前WINDOWS VS LINUX

兒登冧巴溫 2025-02-10 16:36:55

如果做到手機行到, 對各類研究好大助力

いのり 2025-02-10 16:37:58

s1個底係qwen2.5 32B 應該有啲難

有為應作如是觀 2025-02-10 16:39:25

即係蒸餾技術開啟左一條reverse engineering既渠道。任何人只要有access to OpenAI或者其他成熟模型, 都可以通過蒸餾技術複製~90%能力可比既clone。然後Deepseek再通過MoE技術，將呢個clone既性能優化，某啲功能上跑贏GPT或其他大模型。

男朋友對眼好細 2025-02-10 16:40:05

而家反而係第一個出最多力但要食屎，最後一個唔洗出力食九大簋

她馬哥池 2025-02-10 16:43:06

OpenAI 唔一定全部都係優質data, o1 嘅數學同coding 都輸比 Deepseek, Deepseek 可以將所有開源同閉源平台嘅AI model 學習同改良，只係大家只focus 係OpenAI model 上

無OpenAI都可以用其他AI model, 只係當時競爭對手只有OpenAI 可比媲，而家阿里巴巴嘅千義通問等等都可以同R1 o1比較高下

50 美元成功訓練 AI 模型挑戰 DeepSeek AI 教母李飛飛蒸餾他人模型根本不花錢

吉邨春袋子