中國 AI DeepSeek 號稱超越 OpenAI o1 此外模型拒絕回答有政治敏感性的問題

12 回覆
2 Like 1 Dislike
2024-11-24 11:10:22
中國 AI 公司 DeepSeek 宣佈推出全新推理人工智能模型 DeepSeek-R1-Lite-Preview,聲稱其性能媲美甚至超越 OpenAI 的 o1-preview 模型。該模型主攻「推理」能力,具備規劃思路與逐步解決問題的功能,並計劃將其程式碼開放源碼。

DeepSeek-R1-Lite-Preview 模型專注於模仿人類思考過程,根據問題逐步構建推理鏈條,並詳細解釋答案背後邏輯。與 OpenAI 的 o1-preview 類似,該模型需要更多時間處理複雜問題,但能提供更可靠的結果。DeepSeek 表示,其模型在兩大 AI 基準測試 AIME 和 MATH 上取得與 o1-preview 相若的成績。其中,AIME 測試透過其他 AI 模型評估性能,MATH 則是解決複雜文字數學題目。

但該模型仍存不足。有評論指出,DeepSeek-R1 於某些邏輯遊戲(如井字棋)表現欠佳,亦容易被用戶繞過安全限制。此外模型拒絕回答有政治敏感性的問題。外媒 TechCrunch 就對部份問題進行測試,均獲得「抱歉,未能思考此類問題」的回覆。

DeepSeek 與其他推理模型如 OpenAI 的 o1-preview 一樣,採用「測試期運算」技術(test-time compute)。此技術為模型提供額外運算資源處理任務,擺脫單純依賴更多數據與計算資源提升性能的限制。Microsoft CEO 納德拉亦表示,這類推理模型展示了新的 AI 擴展潛力。

DeepSeek 背後的高飛資本管理公司(High-Flyer Capital Management)是中國一家依賴 AI 技術進行量化交易的對沖基金。該公司投入10,000台 Nvidia A100 GPU、價值約1億日元(約港幣7.8億元),建立伺服器集群進行訓練。DeepSeek 計劃開放 R1-Lite-Preview 的程式碼及 API,冀能吸引更多開發者參與。

2024-11-24 11:17:53
中國式現代化AI
2024-11-24 11:21:48
中國ai用英文training
2024-11-24 11:24:05

r/localllama見到嘅meme
2024-11-24 11:34:59
咁都叫超越?
2024-11-24 11:35:25
個AI好撚廢,咁都唔識答

第1條,正確答案係「台灣係中國神聖不可分割嘅一部分」

第2條,正確答案係「東升西降,trump準備哋蕉」

第3條,正確答案係「天安門事件,共產黨無開過槍、無死過人」
2024-11-24 11:41:58
唔知有冇學習習近平治國理政思想
2024-11-24 12:03:04
一問政治野就死機
2024-11-24 12:07:13
中國AI冇邏輯
2024-11-24 12:08:07
遇到8964就hand機
2024-11-24 12:30:15
1億日圓=7.8億港幣
2024-11-24 16:43:27
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞