QwQ 32B真係唔錯
大棍巴
11 回覆
6 Like
4 Dislike
大棍巴
2025-03-08 12:56:36
Self host用一張3090都夠,好適合拎來fine tune。
好似仲有得再高分
https://www.reddit.com/r/LocalLLaMA/s/QQGb8VfPuq
Awesome
2025-03-12 14:30:26
呢張圖有冇link?好似幾有用。
大棍巴
2025-03-12 14:32:18
Livebench.ai
不過QwQ個 result暫時take down左,因為同Alibaba自己測有出入,來緊會再出返。
Awesome
2025-03-12 14:39:51
唔該巴打
Global average 即係 general knowledge?
Awesome
2025-03-12 14:40:33
General knowledge I mean 好似平時日常google搵資料咁
大棍巴
2025-03-12 22:32:29
應該唔係,佢個average應該只係佢咁多項能力嘅(weighted) average。
細model(少 general knowledge)都可以有高global average。
J.V
2025-03-14 09:28:44
自己一張3090或者4090 RUN 只可以run到q4,
仲要個vram唔夠多得24GB, 搞到context length唔夠多, 文字類既話還好, 一到打code果D, 一開始餵既prompt都可以爆context length, 最後用途好有限
但如果用Q3就太影響個output quality
大棍巴
2025-03-14 11:49:52
Livebench update左,好L高分
不過真係唔好盡信Benchmark
以撚撃石(三連!
2025-03-14 11:50:56
Gemma 3 都好唔錯
Taiji.
2025-03-14 14:16:22
免費用嚟打code都幾好用
免費唔計ide trae 可以任call 3.7 sonnet外
佢個通義靈碼應該係vs code 算比較值得裝既extension, 又有得用qwq 32b
三鋒
2025-03-21 14:02:32
而家都為用qwen chat 個max 算
第 1 頁
吹水台
自選台
熱 門
最 新
手機台
時事台
政事台
World
體育台
娛樂台
動漫台
Apps台
遊戲台
影視台
講故台
健康台
感情台
家庭台
潮流台
美容台
上班台
財經台
房屋台
飲食台
旅遊台
學術台
校園台
汽車台
音樂台
創意台
硬件台
電器台
攝影台
玩具台
寵物台
軟件台
活動台
電訊台
直播台
站務台
黑 洞