凳都未坐暖,Alibaba又出左個號稱超越Deepseek V3嘅Qwen2.5-Max

大棍巴

8 回覆
10 Like 3 Dislike
大棍巴 2025-01-29 01:04:11
Qwen2.5-Max (MoE)
https://x.com/alibaba_qwen/status/1884263157574820053?s=46

暫時未係open weight

俾少少 background:
Qwen2.5/Qwen2.5 Coder一直喺Deepseek V3出之前,open weight LLM裏面最高分嘅model。Chinese LLM冒起其實冇好多人眼中咁突如其來,起碼都發展左一年有多,huggingface 上面一路都有得 download來用。有跟開就知過去半年open weight model已經仰中國佬嘅世界

美國佬除左meta之外都係 closed models,一就係Gemma/Phi哩類虧好多嘅細model,歐洲佬個mistral半收皮,印度佬日本仔一條毛都冇
我都唔鐘意共産黨,不過諷刺地,過去半年open weight model全靠中國佬 model頂住
唔係輸係未贏 2025-01-29 01:06:24
死鬼佬班digital nomad點同我地996 it9鬥
掃地研究生 2025-01-29 01:09:57
係時候整條鯰魚嚟炸炸班死鬼佬啦
開大ewaqaea 2025-01-29 01:56:21
Open source 萬歲,closed source 慢慢自high啦
debugger; 2025-01-29 02:14:20
冇放weight,咁不如繼續用chatgpt
當沖客 2025-01-29 02:15:59



大棍巴 2025-01-29 02:27:46
似乎Qwen嘅max series一向唔係open weight,唔知Deepseek嘅出現會唔會改變佢地嘅諗法?
全倉NVDA 2025-01-29 09:24:58
因為qwen用落好廢咪無人care
但DS用落係勁
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞