垃圾Deepseek發佈Deepseek Prover-V2-671B新模型

支共就係國難

13 回覆

3 Like 2 Dislike

支共就係國難 2025-04-30 18:51:09

廢唔廢d，到今時今日剩係可以入163840個tokens?仲話係超長上下文？

DeepSeek今日在AI開源社群 Hugging Face上發布了一個名為DeepSeek-Prover-V2-671B的新模型。

據悉，DeepSeek-Prover-V2-671B使用了更有效率的safetensors檔案格式，並支援多種運算精度，方便模型更快、更省資源地訓練和部署，參數達6710億，或為去年發布的Prover-V1.5數學模型升級版本。同時支援超長上下文，最大位置嵌入達163840，使其能處理複雜的數學證明，並且採用了FP8量化，可透過量化技術減小模型大小，提高推理效率。

link: http://www.aastocks.com/tc/stocks/news/aafn-con/IC4488612/latest-news/INFOCAST

支共就係國難 2025-04-30 18:54:26

百度李彥宏：DeepSeek又慢又廢又貴！
https://lih.kg/3918258
- 分享自 LIHKG 討論區

良心中國科技大佬承認deepseek又廢又貴又抄，中國官方要求佢道歉
https://lih.kg/3886276
- 分享自 LIHKG 討論區

支共就係國難 2025-04-30 18:59:56

Deepseek唔夠其他大模型公司爭，開始剩係谷一個科目