垃圾Deepseek發佈Deepseek Prover-V2-671B新模型

支共就係國難

13 回覆
3 Like 2 Dislike
支共就係國難 2025-04-30 18:51:09
廢唔廢d,到今時今日剩係可以入163840個tokens?仲話係超長上下文?

DeepSeek今日在AI開源社群 Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。

據悉,DeepSeek-Prover-V2-671B使用了更有效率的safetensors檔案格式,並支援多種運算精度,方便模型更快、更省資源地訓練和部署,參數達6710億,或為去年發布的Prover-V1.5數學模型升級版本。同時支援超長上下文,最大位置嵌入達163840,使其能處理複雜的數學證明,並且採用了FP8量化,可透過量化技術減小模型大小,提高推理效率。

link: http://www.aastocks.com/tc/stocks/news/aafn-con/IC4488612/latest-news/INFOCAST
支共就係國難 2025-04-30 18:54:26
百度李彥宏:DeepSeek又慢又廢又貴!
https://lih.kg/3918258
- 分享自 LIHKG 討論區

良心中國科技大佬承認deepseek又廢又貴又抄,中國官方要求佢道歉
https://lih.kg/3886276
- 分享自 LIHKG 討論區
支共就係國難 2025-04-30 18:59:56
Deepseek唔夠其他大模型公司爭,開始剩係谷一個科目
支共就係國難 2025-04-30 19:05:38
睇黎deepseek真係沒落
又廢又冇人討論
甩鳩三島又食屎 2025-04-30 19:09:06
智商超過90未
支共就係國難 2025-04-30 19:10:24
依d specialized model應該仲弱智d

Deepseek末落,IQ被評定為80分
https://lih.kg/3914589
- 分享自 LIHKG 討論區
己攵口羊女子 2025-04-30 19:11:50
V2
DS唔係V1 V2 V3 R1咁去
V2咪即係退步
kooo 2025-04-30 19:24:05
Deepseek Prover-V2-671B
數學模型,俾人計數/數學證明用
唔係一般用既模型
物極必反 2025-04-30 19:29:44
唔止AI 會取代人類,AI 都會取代AI。
港共總書記 2025-04-30 19:30:48
同樣係中國野,豆包好用過佢!
旋風管家一拳超人 2025-04-30 19:36:03
163k夠用
干半干 2025-04-30 19:38:10
或為去年發布的Prover-V1.5數學模型升級版本
連登高天鷲 2025-04-30 19:55:58
80分
證明佢成功模仿小農基因之下嘅思維能力
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞