50 美元成功訓練 AI 模型挑戰 DeepSeek AI 教母李飛飛蒸餾他人模型根本不花錢

245 回覆
57 Like 77 Dislike
2025-02-10 13:07:58
人工智慧領域再次迎來震撼消息,李飛飛教授的團隊僅用不到 50 美元(約港幣 HK$390)成功訓練出一個名為「s1」的推理模型。這個模型在數學和編程能力測試中的表現,與 OpenAI 的 o1 和 DeepSeek 的 R1 等先進推理模型相當。這一成就讓美國科技界驚嘆,也顯示出人工智慧技術的競爭越來越激烈。


李飛飛團隊的 s1 模型,採用了來自 Google 的推理模型 Gemini 2.0 Flash Thinking Experimental 的知識,並利用「蒸餾技術」改善其 AI 模型。蒸餾技術是一種模型壓縮方法,研究人員從一個大型、複雜的模型(稱為“教師模型”)中提取知識,再指導一個較小、較簡單的模型(即“學生模型”)進行學習。這樣,學生模型可以保持較高性能,同時顯著降低計算資源消耗。

先前 DeepSeek 團隊曾公布其將 OpenAI 的訓練成本壓縮至原本的三十分之一,讓許多人認為人工智慧領域的競爭越發激烈。然後李飛飛教授的團隊在短短一個月內,便用不到 50 美元的成本訓練出了媲美 DeepSeek R1 的 AI 推理模型,這無疑再次刷新了成本與效能之間的平衡。


李飛飛團隊的成功表明,蒸餾技術的應用能改善與壓縮大型 AI 模型,還能在資源有限的環境下,保持卓越的性能。這為未來在資源受限的環境中部署和運行大型 AI 模型提供了有效的解決方案。


李飛飛,這位被譽為“AI 教母”的華裔科學家,在人工智慧領域的貢獻不容忽視。她創建了全球最大的圖像識別數據庫——ImageNet,該數據庫包含 21,800 個類別和超過 1,400 萬張圖像,對計算機視覺領域的發展起到了重要作用。目前,李飛飛是斯丹福大學的終身教授,也曾擔任 Google Cloud 的首席科學家。
2025-02-10 13:08:20
先睇完李飛飛係咩國藉既人先好比負評
2025-02-10 13:09:20
李飛飛1976年出生於中國大陸北京,在四川成都長大,12歲時,父親遠赴美國。四年後1992年,15歲的李飛飛隨母親一起赴美國新澤西州帕西帕尼-特洛伊山,與父親團聚並移民定居[9]。剛到美國的最初兩年,家庭生活拮据,她曾到餐館打工,做過家庭清潔工;父母后來跟親友借錢,開了一家乾洗店經營[10]。初到美國的她需從頭開始學習英語,就讀位於新澤西的帕西帕尼高中,1995年以全班第六名的成績畢業,SAT取得1250分,其中數學得滿分800分,獲得了普林斯頓大學的獎學金,進入普林斯頓大學學習;在大學期間,大多數週末她都回家到父母的乾洗店幫忙工作,在校學習時課餘時間也常通過電話幫助父母接待乾洗店的顧客[10][9]。她日後的成就令她在2017年被帕西帕尼高中列入該校的名人堂[11]。
2025-02-10 13:09:53
呢個就真係超級勁
2025-02-10 13:10:46
突發!考試抄隔離唔洗溫書!
根本溫書性價比極低
2025-02-10 13:10:57
無主模型你蒸餾個屁
2025-02-10 13:11:30
https://huggingface.co/simplescaling/s1-32B

s1 is a reasoning model finetuned from Qwen2.5-32B-Instruct on just 1,000 examples. It matches o1-preview & exhibits test-time scaling via budget forcing.
2025-02-10 13:12:05
咪又係支那人
2025-02-10 13:12:25
入藉左美國
2025-02-10 13:13:15
佢同Andrew Ng 喺AI行業好出名
2025-02-10 13:14:27
大陸夠有個阿婆研發左晶片啦
2025-02-10 13:15:17
呢個人係ai好出名
人地係美國人
2025-02-10 13:15:28
唔好意思
唔係太識
想問除咗壓低成本
本身個蒸餾技術有冇咩創新性?
2025-02-10 13:15:45
又係靠中國人
最後咪又係我地中國贏
2025-02-10 13:16:24
人型蜈蚣, 第一個先係食九大簋
2025-02-10 13:17:10
呢個女人冇可能冇俾大陸統戰
2025-02-10 13:17:47
你只係想食鮑魚
無必要隊曬成枱餸既
2025-02-10 13:18:29
父母均為在中國大陸完成教育的知識分子,但因不諳英語,在美國不能從事工程師或科學研究工作;父親曾做過照相機修理工,母親曾做過收銀員。[10]
2025-02-10 13:19:06
即係咩晶片都唔洗?
點解50鎂就搞得掂 唔係好明
2025-02-10 13:19:21
呢個係美國國家級別科學家
你估咁易統咩
2025-02-10 13:23:25
咪又係偷deep seek
2025-02-10 13:25:01
即係話支那deepseek落格左5百幾萬?
2025-02-10 13:25:34
唔識英文既知識分子
唔識英文又移到過去美國
墨西哥走過去
2025-02-10 13:27:00
支那人就係偷呃拐騙抄,對世界完全無貢獻
2025-02-10 13:27:56
呢個嚴格黎講美國人黎
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞