Deepseek V3 0323 update 大幅度提升coding能力
大棍巴
16 回覆
2 Like
5 Dislike
大棍巴
2025-03-25 08:48:27
Aider
Reddit discussion:
https://www.reddit.com/r/LocalLLaMA/s/aYukTHRmrY
Misguided attention:
https://www.reddit.com/r/LocalLLaMA/s/P6npiO1fR1
白龍紙蝦
2025-03-25 09:33:40
R1同V3有咩關係...?
極北鷲
2025-03-25 10:15:36
我想要FIM model
而家仲用緊qwn2.5 coder
大棍巴
2025-03-25 10:23:18
R1係base on V3 (上年十月版本)嘅 reasoning model。
要類比,可以理解為
GPT-4o —> V3
GPT-o1 —> R1
大棍巴
2025-03-25 10:23:49
可以用Claude Sonnet 3.7
power_off
2025-03-25 12:02:28
聽聞個 web search 好廢
支共就係國難
2025-03-25 12:04:25
中國LLM通用推理唔掂,開始剩係谷coding
但coding都上唔到第一
大棍巴
2025-03-25 12:16:11
General knowledge都係暫時不及o1。
不過正如Claude,搞得掂coding已經可以佔到好大部分market。
至於coding,non reasoning model裏面新V3已經係僅次於Sonnect 3.7嘅存在,先不論佢仲要係open weight裏面最強。
大棍巴
2025-03-25 12:17:45
用左幾次,覺得哂token就停用左
反正我用得Claude嘅嘢我一定feed好多domain knowledge 俾佢,web search反而唔重要。
兼職陰陽師
2025-03-25 12:30:00
等睇有人入嚟屌支製llm抄ClosedAI
大棍巴
2025-03-25 12:32:29
佢係distill出來,有人咁諗又無可厚非。不過都要有實力先抄到
Ano
2025-03-25 12:36:47
Dklm o3mini搞到我功課無full mark
大棍巴
2025-03-25 13:01:28
https://www.reddit.com/r/DeepSeek/comments/1jjar8p/deepseek_v3_0324_benchmarks_compared_to_sonnet_37/
極北鷲
2025-03-25 16:32:51
claude應唔係FIM
大棍巴
2025-03-25 17:31:06
你講返,check完又真係好似冇train到FIM
極北鷲
2025-03-25 17:32:12
cursor個autocomplete都係用自家model架
第 1 頁
吹水台
自選台
熱 門
最 新
手機台
時事台
政事台
World
體育台
娛樂台
動漫台
Apps台
遊戲台
影視台
講故台
健康台
感情台
家庭台
潮流台
美容台
上班台
財經台
房屋台
飲食台
旅遊台
學術台
校園台
汽車台
音樂台
創意台
硬件台
電器台
攝影台
玩具台
寵物台
軟件台
活動台
電訊台
直播台
站務台
黑 洞