中國 AI 公司 DeepSeek 宣佈推出全新推理人工智能模型 DeepSeek-R1-Lite-Preview,聲稱其性能媲美甚至超越 OpenAI 的 o1-preview 模型。該模型主攻「推理」能力,具備規劃思路與逐步解決問題的功能,並計劃將其程式碼開放源碼。
DeepSeek-R1-Lite-Preview 模型專注於模仿人類思考過程,根據問題逐步構建推理鏈條,並詳細解釋答案背後邏輯。與 OpenAI 的 o1-preview 類似,該模型需要更多時間處理複雜問題,但能提供更可靠的結果。DeepSeek 表示,其模型在兩大 AI 基準測試 AIME 和 MATH 上取得與 o1-preview 相若的成績。其中,AIME 測試透過其他 AI 模型評估性能,MATH 則是解決複雜文字數學題目。
但該模型仍存不足。有評論指出,DeepSeek-R1 於某些邏輯遊戲(如井字棋)表現欠佳,亦容易被用戶繞過安全限制。此外模型拒絕回答有政治敏感性的問題。外媒 TechCrunch 就對部份問題進行測試,均獲得「抱歉,未能思考此類問題」的回覆。
DeepSeek 與其他推理模型如 OpenAI 的 o1-preview 一樣,採用「測試期運算」技術(test-time compute)。此技術為模型提供額外運算資源處理任務,擺脫單純依賴更多數據與計算資源提升性能的限制。Microsoft CEO 納德拉亦表示,這類推理模型展示了新的 AI 擴展潛力。
DeepSeek 背後的高飛資本管理公司(High-Flyer Capital Management)是中國一家依賴 AI 技術進行量化交易的對沖基金。該公司投入10,000台 Nvidia A100 GPU、價值約1億日元(約港幣7.8億元),建立伺服器集群進行訓練。DeepSeek 計劃開放 R1-Lite-Preview 的程式碼及 API,冀能吸引更多開發者參與。