人工智慧領域再次迎來震撼消息,李飛飛教授的團隊僅用不到 50 美元(約港幣 HK$390)成功訓練出一個名為「s1」的推理模型。這個模型在數學和編程能力測試中的表現,與 OpenAI 的 o1 和 DeepSeek 的 R1 等先進推理模型相當。這一成就讓美國科技界驚嘆,也顯示出人工智慧技術的競爭越來越激烈。
李飛飛團隊的 s1 模型,採用了來自 Google 的推理模型 Gemini 2.0 Flash Thinking Experimental 的知識,並利用「蒸餾技術」改善其 AI 模型。蒸餾技術是一種模型壓縮方法,研究人員從一個大型、複雜的模型(稱為“教師模型”)中提取知識,再指導一個較小、較簡單的模型(即“學生模型”)進行學習。這樣,學生模型可以保持較高性能,同時顯著降低計算資源消耗。
先前 DeepSeek 團隊曾公布其將 OpenAI 的訓練成本壓縮至原本的三十分之一,讓許多人認為人工智慧領域的競爭越發激烈。然後李飛飛教授的團隊在短短一個月內,便用不到 50 美元的成本訓練出了媲美 DeepSeek R1 的 AI 推理模型,這無疑再次刷新了成本與效能之間的平衡。
李飛飛團隊的成功表明,蒸餾技術的應用能改善與壓縮大型 AI 模型,還能在資源有限的環境下,保持卓越的性能。這為未來在資源受限的環境中部署和運行大型 AI 模型提供了有效的解決方案。
李飛飛,這位被譽為“AI 教母”的華裔科學家,在人工智慧領域的貢獻不容忽視。她創建了全球最大的圖像識別數據庫——ImageNet,該數據庫包含 21,800 個類別和超過 1,400 萬張圖像,對計算機視覺領域的發展起到了重要作用。目前,李飛飛是斯丹福大學的終身教授,也曾擔任 Google Cloud 的首席科學家。