50 美元成功訓練 AI 模型挑戰 DeepSeek AI 教母李飛飛蒸餾他人模型根本不花錢

吉邨春袋子

260 回覆

66 Like 85 Dislike

吉邨春袋子 2025-02-10 13:07:58

人工智慧領域再次迎來震撼消息，李飛飛教授的團隊僅用不到 50 美元（約港幣 HK$390）成功訓練出一個名為「s1」的推理模型。這個模型在數學和編程能力測試中的表現，與 OpenAI 的 o1 和 DeepSeek 的 R1 等先進推理模型相當。這一成就讓美國科技界驚嘆，也顯示出人工智慧技術的競爭越來越激烈。

李飛飛團隊的 s1 模型，採用了來自 Google 的推理模型 Gemini 2.0 Flash Thinking Experimental 的知識，並利用「蒸餾技術」改善其 AI 模型。蒸餾技術是一種模型壓縮方法，研究人員從一個大型、複雜的模型（稱為“教師模型”）中提取知識，再指導一個較小、較簡單的模型（即“學生模型”）進行學習。這樣，學生模型可以保持較高性能，同時顯著降低計算資源消耗。

先前 DeepSeek 團隊曾公布其將 OpenAI 的訓練成本壓縮至原本的三十分之一，讓許多人認為人工智慧領域的競爭越發激烈。然後李飛飛教授的團隊在短短一個月內，便用不到 50 美元的成本訓練出了媲美 DeepSeek R1 的 AI 推理模型，這無疑再次刷新了成本與效能之間的平衡。

李飛飛團隊的成功表明，蒸餾技術的應用能改善與壓縮大型 AI 模型，還能在資源有限的環境下，保持卓越的性能。這為未來在資源受限的環境中部署和運行大型 AI 模型提供了有效的解決方案。

李飛飛，這位被譽為“AI 教母”的華裔科學家，在人工智慧領域的貢獻不容忽視。她創建了全球最大的圖像識別數據庫——ImageNet，該數據庫包含 21,800 個類別和超過 1,400 萬張圖像，對計算機視覺領域的發展起到了重要作用。目前，李飛飛是斯丹福大學的終身教授，也曾擔任 Google Cloud 的首席科學家。

吉邨春袋子 2025-02-10 13:08:20

先睇完李飛飛係咩國藉既人先好比負評

吉邨春袋子 2025-02-10 13:09:20

李飛飛1976年出生於中國大陸北京，在四川成都長大，12歲時，父親遠赴美國。四年後1992年，15歲的李飛飛隨母親一起赴美國新澤西州帕西帕尼-特洛伊山，與父親團聚並移民定居[9]。剛到美國的最初兩年，家庭生活拮据，她曾到餐館打工，做過家庭清潔工；父母后來跟親友借錢，開了一家乾洗店經營[10]。初到美國的她需從頭開始學習英語，就讀位於新澤西的帕西帕尼高中，1995年以全班第六名的成績畢業，SAT取得1250分，其中數學得滿分800分，獲得了普林斯頓大學的獎學金，進入普林斯頓大學學習；在大學期間，大多數週末她都回家到父母的乾洗店幫忙工作，在校學習時課餘時間也常通過電話幫助父母接待乾洗店的顧客[10][9]。她日後的成就令她在2017年被帕西帕尼高中列入該校的名人堂[11]。

吉邨春袋子 2025-02-10 13:09:53

呢個就真係超級勁

牛軍已掠地 2025-02-10 13:10:46

突發！考試抄隔離唔洗溫書！
根本溫書性價比極低

水沝淼 2025-02-10 13:10:57

無主模型你蒸餾個屁

天才小釣手 2025-02-10 13:11:30

https://huggingface.co/simplescaling/s1-32B

s1 is a reasoning model finetuned from Qwen2.5-32B-Instruct on just 1,000 examples. It matches o1-preview & exhibits test-time scaling via budget forcing.

梅建國01 2025-02-10 13:12:05

咪又係支那人

吉邨春袋子 2025-02-10 13:12:25

入藉左美國