Deepseek V3 0323 update 大幅度提升coding能力

大棍巴

16 回覆
2 Like 5 Dislike
大棍巴 2025-03-25 08:48:27
白龍紙蝦 2025-03-25 09:33:40
R1同V3有咩關係...?
極北鷲 2025-03-25 10:15:36
我想要FIM model
而家仲用緊qwn2.5 coder
大棍巴 2025-03-25 10:23:18
R1係base on V3 (上年十月版本)嘅 reasoning model。

要類比,可以理解為
GPT-4o —> V3
GPT-o1 —> R1
大棍巴 2025-03-25 10:23:49
可以用Claude Sonnet 3.7
power_off 2025-03-25 12:02:28
聽聞個 web search 好廢
支共就係國難 2025-03-25 12:04:25
中國LLM通用推理唔掂,開始剩係谷coding
但coding都上唔到第一
大棍巴 2025-03-25 12:16:11
General knowledge都係暫時不及o1。
不過正如Claude,搞得掂coding已經可以佔到好大部分market。

至於coding,non reasoning model裏面新V3已經係僅次於Sonnect 3.7嘅存在,先不論佢仲要係open weight裏面最強。
大棍巴 2025-03-25 12:17:45
用左幾次,覺得哂token就停用左
反正我用得Claude嘅嘢我一定feed好多domain knowledge 俾佢,web search反而唔重要。
兼職陰陽師 2025-03-25 12:30:00
等睇有人入嚟屌支製llm抄ClosedAI
大棍巴 2025-03-25 12:32:29
佢係distill出來,有人咁諗又無可厚非。不過都要有實力先抄到
Ano 2025-03-25 12:36:47
Dklm o3mini搞到我功課無full mark
大棍巴 2025-03-25 13:01:28
極北鷲 2025-03-25 16:32:51
claude應唔係FIM
大棍巴 2025-03-25 17:31:06
你講返,check完又真係好似冇train到FIM
極北鷲 2025-03-25 17:32:12
cursor個autocomplete都係用自家model架
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞