50 美元成功訓練 AI 模型挑戰 DeepSeek AI 教母李飛飛蒸餾他人模型根本不花錢
吉邨春袋子
253
回覆
62 Like
81 Dislike
第 1 頁
第 2 頁
第 3 頁
第 4 頁
第 5 頁
第 6 頁
第 7 頁
第 8 頁
第 9 頁
第 10 頁
第 11 頁
甜妹號
2025-02-10 16:01:29
我信Alex Wang
DeepSeek offline 版可以用
DBAA
2025-02-10 16:02:05
半年之後財報可能爆雷,有賺好走小小。
いのり
2025-02-10 16:03:42
? ching 1999
可唔可以elaborate
唉又係A餐呀
2025-02-10 16:05:31
咁皮褸黃算甚麼?
甜妹號
2025-02-10 16:07:55
係可能,當MoE 設計良好
利用不同領域專家更有效
呢一點係要讚DeepSeek
路姆閪
2025-02-10 16:09:23
迴力鏢
薑汁汽水
2025-02-10 16:11:42
reddit有人分析過o3好似hide左
變summarize既推理過程
變相點問都冇用
俊桃丸鳴
2025-02-10 16:11:48
呢個強項黎 由新伯倫 瑞幸咖啡 到 百度 小紅書 byd c919 抄人永遠最低成平(唔犯法罰錢既話)
いのり
2025-02-10 16:13:52
再講落去都無咩價值 已經知你唔係subject matter expert只係個9upper
其實點解死要支持用distillation呢隻字?
paper明明無提過r1 post-training有做distillation
真係OpenAI求其accuse完Deepseek偷data你地就上咗癮用buzzword?
誠哥的繼承者們
2025-02-10 16:15:35
如果OpenAI, meta, google唔再有新模型出,佢個模型應該就唔會再有乜進步
李飛飛係咪俾x炒左?
革命界KOL毛澤東
2025-02-10 16:19:30
我用緊o3mini 同high
都有寫過程出嚟
同埋追問係無得hide
除非當晒敏感字全部唔答
印鈔機CEO
2025-02-10 16:21:00
邊個用左個名
2025-02-10 16:21:28
蒸餾技術即係戰機引擎同客機引擎分別
大家都飛到
いのり
2025-02-10 16:22:52
首先deepseek係generative pre-trained transformer無錯架wor
另外如果你係想佢deepseek claim自己係嚟自OpenAI
claude同gemini夠有啦 日經
OpenAI飲到頭啖湯就係咁架啦
革命界KOL毛澤東
2025-02-10 16:25:04
啱唔晒又錯唔晒
openai set data唔係公海啲data嚟
做好咗filtering 同labeling 個data quality 差好遠
已經係openai自家嘅product嚟
唔能夠話同偷公海data嚟用無分別
姐係餐廳偷隻牛返嚟定偷啲牛扒返嚟
要班廚自己劏埋牛再開料成本一定高
去偷牛扒直接得返煎嘅過程咁一定平
而r1 s1都係要依靠呢啲優質嘅data 先可以train出嚟
無呢set嘢train出嚟都只係垃圾
Ysamliu
2025-02-10 16:25:49
你都係答唔到openai得把口無實則咩證明
同時openai自己本身一樣有爭議佢都有所謂既抄人
50你又知唔知係咩黎,只講training
之前有人話30都搞掂添
Now, AI researchers at the University of California, Berkeley, claim to have replicated the R1 model for under $30
李飛飛呢單都成個星期前咁滯,都炒唔起話題,你估係咪你覺得咁開心大發現
港女洋腸夢
2025-02-10 16:27:40
留名
Ysamliu
2025-02-10 16:29:10
佢唔得
因為明顯為反而反
人講佢講9up反
港女洋腸夢
2025-02-10 16:33:14
就咁睇好似純粹係將個AI Model 加返個reasoning,依家普通人都可以做到
https://www.youtube.com/watch?v=aNisiIo1xBY
兒登冧巴溫
2025-02-10 16:35:54
有D似回到十幾年前WINDOWS VS LINUX
兒登冧巴溫
2025-02-10 16:36:55
如果做到手機行到, 對各類研究好大助力
いのり
2025-02-10 16:37:58
s1個底係qwen2.5 32B 應該有啲難
有為應作如是觀
2025-02-10 16:39:25
即係蒸餾技術開啟左一條reverse engineering既渠道。任何人只要有access to OpenAI或者其他成熟模型, 都可以通過蒸餾技術複製~90%能力可比既clone。然後Deepseek再通過MoE技術,將呢個clone既性能優化,某啲功能上跑贏GPT或其他大模型。
男朋友對眼好細
2025-02-10 16:40:05
而家反而係第一個出最多力但要食屎,最後一個唔洗出力食九大簋
她馬哥池
2025-02-10 16:43:06
OpenAI 唔一定全部都係優質data, o1 嘅數學同coding 都輸比 Deepseek, Deepseek 可以將所有開源同閉源平台嘅AI model 學習同改良,只係大家只focus 係OpenAI model 上
無OpenAI都可以用其他AI model, 只係當時競爭對手只有OpenAI 可比媲,而家阿里巴巴嘅千義通問等等都可以同R1 o1比較高下
第 1 頁
第 2 頁
第 3 頁
第 4 頁
第 5 頁
第 6 頁
第 7 頁
第 8 頁
第 9 頁
第 10 頁
第 11 頁
吹水台
自選台
熱 門
最 新
手機台
時事台
政事台
World
體育台
娛樂台
動漫台
Apps台
遊戲台
影視台
講故台
健康台
感情台
家庭台
潮流台
美容台
上班台
財經台
房屋台
飲食台
旅遊台
學術台
校園台
汽車台
音樂台
創意台
硬件台
電器台
攝影台
玩具台
寵物台
軟件台
活動台
電訊台
直播台
站務台
黑 洞