
根據最新公布的跑分結果,Doubao 1.5 Pro 在 14 項基準測試中表現突出。特別是在推理能力和程式設計等領域,Doubao 1.5 Pro 在「BBH」推理測試中取得 91.6 的高分,而在「McEval」程式碼測試中也獲得了 70.2 分,這些分數分別超越了 OpenAI 的 GPT-4(分別為 89.2 和 58.7)及 Google 的 Gemini(分別為 92.6 和 67.0)。這顯示 Doubao 1.5 Pro 在推理與程式設計能力方面的強勁實力。
在中國語言理解的測試「C-Eval」中,Doubao 1.5 Pro 也獲得了 91.8 的高分,超過了其他主要競爭對手的表現,顯示其在中文語境下的強大理解力。相比之下,OpenAI 的 GPT-4 和 Google 的 Gemini 在此領域的分數為 76.0 和 84.3。
https://unwire.hk/2025/01/25/doubao-1-5-pro/ai/