大陸 Kimi K2 又卷 Claude Code

明明三 2025-07-14 17:03:23

便 claude code 一大截，仲可以用原本個claude code 來行

好痴線

基於最新嘅網上搜索結果（截至2025年7月14日），我嚟總結下Kimi K2（Moonshot AI 新出嘅1T 參數 MoE 模型，據報喺7月13日發布）同Claude（Anthropic 嘅模型，特別指佢嘅 coding 能力，比如 Claude-4 Sonnet 或 Opus）嘅編碼水平比較，以及用戶評價。呢個分析主要嚟自 Reddit、Medium、YouTube、Hacker News 同其他 AI 社區討論，聚焦喺 benchmarks 同真實用戶反饋。

1. 編碼水平比較：差幾遠？
Kimi K2 主要定位喺 coding 同 agentic tasks（代理式任務），佢喺多個 benchmarks 上表現出色，總體嚟講同 Claude 嘅 coding 水平不相上下，甚至喺某些方面略勝一籌。差異唔算大（唔係天差地遠），但 Kimi K2 更注重實用性、效率同成本，Claude 則更強喺複雜邏輯同過度工程化設計。以下係關鍵比較：

Benchmarks 數據（嚟自官方同第三方測試）：
SWE-Bench Verified（代理編碼基準，測真實 coding 任務成功率）：Kimi K2 得分 65.8%（pass@1），係目前 open models 嘅 SOTA（state-of-the-art）。Claude-4 Sonnet 大約 50-55%，Claude-4 Opus 接近 65-70%。Kimi K2 已擊敗 Sonnet，接近或平起平坐 Opus。
LiveCodeBench（實時 coding 基準）：Kimi K2 53.7%，擊敗 GPT-4（44.7%），並且據報強過 Claude 嘅早期版本。
其他：Kimi K2 喺多語言 coding（SWE-Bench Multilingual）得分 47.3%，整體表現接近 Claude，但 Kimi 更高效（128K token context window，支持長上下文）。
差異點：
Kimi K2 優勢：寫 code 更簡單、可讀性高、唔會過度複雜化（e.g. 唔加多餘嘅 abstraction）。用戶話佢適合日常開發，速度快、成本低（API 價錢只係 $0.6/M input, $2.5/M output，類似 Gemini Flash，但效能更好）。
Claude 優勢：喺超複雜任務上更穩（e.g. over-engineered solutions），但有時被批評太 "fancy"，唔夠實用。
總結：如果 Claude 係 9/10 分，Kimi K2 至少 8.5-9.5 分，視乎任務。差異唔大，但 Kimi K2 喺2025年新出，性價比更高，部分 benchmarks 已 "殺" 咗 Claude Sonnet。
實際應用：有工具如 Cline 或 OpenCode 可以將 Kimi K2 整合到 VS Code，方便同 Claude Code 一齊用。用戶報導 Kimi K2 喺生成代碼時更快、更準，特別喺 open weights 模型中。

努力做個IT狗 2025-07-14 17:20:30

留名

真天真 2025-07-14 19:51:56

用大陸野
資料送中
免費係最貴嘅

天才小釣手 2025-07-15 11:48:48

真天真你真天真
open weight㗎😅

明明三 2025-07-15 12:18:27

要送都送晒

今年仲講私隱

真天真 2025-07-15 12:24:20

九唔搭八
Open weight 又點？
人哋大陸野收得你錢
入面有木馬唔通又講你知？

圄囿囡囚 2025-07-15 13:46:16

果然無改錯名

股場新手 2025-07-15 13:57:55

你好快會被5毛了

大棍巴 2025-07-15 14:10:12

Claude 同Claude Code你分返清楚先

Claude Sonnet/Opus係個model，Claude Code係個tool/frame work。

就咁比較Claude Sonnet/Opus同Kimi K2冇問題，但Kimi應該暫時未有類似Claude Code嘅tool。

實際使用上，就算Kimi+Cursor/VSCode RooCode/Cline，我諗作為Coding agent應該仍然唔會及得上Claude Code。

明明三 2025-07-15 14:13:56

Kimi k2 可以騎劫claude code 度行，用custom key 同endpoint 就可以完美行

動能價值 2025-07-15 14:16:06

親身用落仲廢過deepseek