QwQ 32B真係唔錯

大棍巴

11 回覆
6 Like 4 Dislike
大棍巴 2025-03-08 12:56:36
Self host用一張3090都夠,好適合拎來fine tune。


好似仲有得再高分
https://www.reddit.com/r/LocalLLaMA/s/QQGb8VfPuq
Awesome 2025-03-12 14:30:26
呢張圖有冇link?好似幾有用。
大棍巴 2025-03-12 14:32:18
Livebench.ai

不過QwQ個 result暫時take down左,因為同Alibaba自己測有出入,來緊會再出返。
Awesome 2025-03-12 14:39:51
唔該巴打 Global average 即係 general knowledge?
Awesome 2025-03-12 14:40:33
General knowledge I mean 好似平時日常google搵資料咁
大棍巴 2025-03-12 22:32:29
應該唔係,佢個average應該只係佢咁多項能力嘅(weighted) average。

細model(少 general knowledge)都可以有高global average。
J.V 2025-03-14 09:28:44
自己一張3090或者4090 RUN 只可以run到q4,
仲要個vram唔夠多得24GB, 搞到context length唔夠多, 文字類既話還好, 一到打code果D, 一開始餵既prompt都可以爆context length, 最後用途好有限

但如果用Q3就太影響個output quality
大棍巴 2025-03-14 11:49:52
Livebench update左,好L高分
不過真係唔好盡信Benchmark

以撚撃石(三連! 2025-03-14 11:50:56
Gemma 3 都好唔錯
Taiji. 2025-03-14 14:16:22
免費用嚟打code都幾好用
免費唔計ide trae 可以任call 3.7 sonnet外
佢個通義靈碼應該係vs code 算比較值得裝既extension, 又有得用qwq 32b
三鋒 2025-03-21 14:02:32
而家都為用qwen chat 個max 算
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞