Deepseek V3 0323 update 大幅度提升coding能力

大棍巴

16 回覆

2 Like 5 Dislike

大棍巴 2025-03-25 08:48:27

Aider

白龍紙蝦 2025-03-25 09:33:40

R1同V3有咩關係...?

極北鷲 2025-03-25 10:15:36

我想要FIM model
而家仲用緊qwn2.5 coder

大棍巴 2025-03-25 10:23:18

R1係base on V3 (上年十月版本)嘅 reasoning model。

要類比，可以理解為
GPT-4o —> V3
GPT-o1 —> R1

大棍巴 2025-03-25 10:23:49

可以用Claude Sonnet 3.7

power_off 2025-03-25 12:02:28

聽聞個 web search 好廢

支共就係國難 2025-03-25 12:04:25

中國LLM通用推理唔掂，開始剩係谷coding

但coding都上唔到第一

大棍巴 2025-03-25 12:16:11

General knowledge都係暫時不及o1。
不過正如Claude，搞得掂coding已經可以佔到好大部分market。

至於coding，non reasoning model裏面新V3已經係僅次於Sonnect 3.7嘅存在，先不論佢仲要係open weight裏面最強。

大棍巴 2025-03-25 12:17:45

用左幾次，覺得哂token就停用左

反正我用得Claude嘅嘢我一定feed好多domain knowledge 俾佢，web search反而唔重要。

兼職陰陽師 2025-03-25 12:30:00

等睇有人入嚟屌支製llm抄ClosedAI

大棍巴 2025-03-25 12:32:29

佢係distill出來，有人咁諗又無可厚非。不過都要有實力先抄到

Ano 2025-03-25 12:36:47

Dklm o3mini搞到我功課無full mark

大棍巴 2025-03-25 13:01:28

極北鷲 2025-03-25 16:32:51

claude應唔係FIM

大棍巴 2025-03-25 17:31:06

你講返，check完又真係好似冇train到FIM

極北鷲 2025-03-25 17:32:12

cursor個autocomplete都係用自家model架