大陸 Kimi K2 又卷 Claude Code

明明三

17 回覆
4 Like 7 Dislike
明明三 2025-07-14 17:03:23
便 claude code 一大截 ,仲可以用原本個claude code 來行
好痴線


基於最新嘅網上搜索結果(截至2025年7月14日),我嚟總結下Kimi K2(Moonshot AI 新出嘅1T 參數 MoE 模型,據報喺7月13日發布)同Claude(Anthropic 嘅模型,特別指佢嘅 coding 能力,比如 Claude-4 Sonnet 或 Opus)嘅編碼水平比較,以及用戶評價。呢個分析主要嚟自 Reddit、Medium、YouTube、Hacker News 同其他 AI 社區討論,聚焦喺 benchmarks 同真實用戶反饋。

1. 編碼水平比較:差幾遠?
Kimi K2 主要定位喺 coding 同 agentic tasks(代理式任務),佢喺多個 benchmarks 上表現出色,總體嚟講同 Claude 嘅 coding 水平 不相上下,甚至喺某些方面略勝一籌。差異唔算大(唔係天差地遠),但 Kimi K2 更注重實用性、效率同成本,Claude 則更強喺複雜邏輯同過度工程化設計。以下係關鍵比較:

Benchmarks 數據(嚟自官方同第三方測試):
SWE-Bench Verified(代理編碼基準,測真實 coding 任務成功率):Kimi K2 得分 65.8%(pass@1),係目前 open models 嘅 SOTA(state-of-the-art)。Claude-4 Sonnet 大約 50-55%,Claude-4 Opus 接近 65-70%。Kimi K2 已擊敗 Sonnet,接近或平起平坐 Opus。
LiveCodeBench(實時 coding 基準):Kimi K2 53.7%,擊敗 GPT-4(44.7%),並且據報強過 Claude 嘅早期版本。
其他:Kimi K2 喺多語言 coding(SWE-Bench Multilingual)得分 47.3%,整體表現接近 Claude,但 Kimi 更高效(128K token context window,支持長上下文)。
差異點:
Kimi K2 優勢:寫 code 更簡單、可讀性高、唔會過度複雜化(e.g. 唔加多餘嘅 abstraction)。用戶話佢適合日常開發,速度快、成本低(API 價錢只係 $0.6/M input, $2.5/M output,類似 Gemini Flash,但效能更好)。
Claude 優勢:喺超複雜任務上更穩(e.g. over-engineered solutions),但有時被批評太 "fancy",唔夠實用。
總結:如果 Claude 係 9/10 分,Kimi K2 至少 8.5-9.5 分,視乎任務。差異唔大,但 Kimi K2 喺2025年新出,性價比更高,部分 benchmarks 已 "殺" 咗 Claude Sonnet。
實際應用:有工具如 Cline 或 OpenCode 可以將 Kimi K2 整合到 VS Code,方便同 Claude Code 一齊用。用戶報導 Kimi K2 喺生成代碼時更快、更準,特別喺 open weights 模型中。
努力做個IT狗 2025-07-14 17:20:30
留名
真天真 2025-07-14 19:51:56
用大陸野
資料送中
免費係最貴嘅
天才小釣手 2025-07-15 11:48:48
真天真你真天真
open weight㗎😅
明明三 2025-07-15 12:18:27
要送都送晒
今年仲講私隱
真天真 2025-07-15 12:24:20
九唔搭八
Open weight 又點?
人哋大陸野收得你錢
入面有木馬唔通又講你知?
圄囿囡囚 2025-07-15 13:46:16
果然無改錯名
股場新手 2025-07-15 13:57:55
你好快會被5毛了
大棍巴 2025-07-15 14:10:12
Claude 同Claude Code你分返清楚先
Claude Sonnet/Opus係個model,Claude Code係個tool/frame work。

就咁比較Claude Sonnet/Opus同Kimi K2冇問題,但Kimi應該暫時未有類似Claude Code嘅tool。

實際使用上,就算Kimi+Cursor/VSCode RooCode/Cline,我諗作為Coding agent應該仍然唔會及得上Claude Code。
明明三 2025-07-15 14:13:56
Kimi k2 可以騎劫claude code 度行 ,用custom key 同endpoint 就可以完美行
動能價值 2025-07-15 14:16:06
親身用落仲廢過deepseek
得個幾十k token context windows
明明三 2025-07-15 14:19:25
大棍巴 2025-07-15 14:22:59
咁要睇下出來個效果點,感覺上Claude+Claude Code一齊train出來,夾好多。

見過好多Claude Code proxy,但實際上好少見人推薦用Claude Code+其他model。
明明三 2025-07-15 14:23:57
問題係性價比
上youtube 好多實測
明明三 2025-07-15 14:26:01
抵比AI 淘汰既盲毛
大棍巴 2025-07-15 14:26:30
Claude Max subscription 一個月$200 USD,你可以用到等於2000-3000 USD嘅API用量
努力做個IT狗 2025-07-15 15:27:04
想sub MAX 200, 但係香港blocked, claude check 呢啲VPN最嚴,隨時封ac
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞