Mistral announced new coding model: Devstral

大棍巴

7 回覆
2 Like 1 Dislike
大棍巴 2025-05-21 23:24:59
兼職陰陽師 2025-05-21 23:26:09
咁細
我係英國人呀屌 2025-05-21 23:31:02
lm
sparda 2025-05-22 12:42:27
似乎好處係self host
無同claude 3.7 同gemini 2.5 pro知咩事啦
大棍巴 2025-05-22 13:12:49
哩啲係local LLM,通常都係32B或以下嘅細model,一張3090都用得到,一般唔會攞來同SOTA closed model直接比較。出面嗰啲大model通常講緊幾百甚至上千B parameters,遠比起細model有優勢。

細model通常都係用來俾人加domain knowledge/做RAG/fine tune/local agent來用。攞來駁VSCode做pair programming,哩類local model都可以幫手debug。
GaoGao 2025-05-22 13:16:09
deepseek咪6百幾b,佢而家就係講贏大model
大棍巴 2025-05-22 13:29:00
哩啲聽下好,要講贏,佢show到 Aider Polygot高分得過Deepseek V3 0324我就信多少少。
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞