Alibaba出左一系列Qwen 3 models

大棍巴

63 回覆
6 Like 7 Dislike
以直報怨 2025-05-15 16:55:51
依家最好既Multimodal open source model 係咩(主要image understanding 的話)?我試左gemma 3,啲人之前講到佢好勁,但實測好廢。

Mistral 同 QwQ 未試
DAN_DAN 2025-05-15 16:57:28
Gemma 3係勁在細模型可以係edge度run

absolute值佢唔係最強
以直報怨 2025-05-15 16:59:46
Gemma3 27B 今時今日都唔算好細喇
但都係同gemini 2同gpt-4o-mini 無得比
大棍巴 2025-05-15 17:03:18
用完Gemini 俾大context window縱壞哂,而家我連Claude都少用左。

啲library太大嘅時候,可以餵Gemini好正
大棍巴 2025-05-15 17:23:10
印象中啲人講Qwen 2.5 VL 72B認圖幾好。
以直報怨 2025-06-07 22:49:23
我試完mistral, gemma3, qwen 2 VL, qwen2.5 VL.
Qwen2.5 VL 贏成條街
不過佢72B 唔算公平比拼既
大棍巴 2025-06-07 23:16:03
可以試埋Qwen 2.5 VL 7B,好似都ok
以直報怨 2025-06-07 23:57:09
想試Qwen Coder 配Cline
暫時淨係覺得Sonnet 同Gemini勁
想搵個Local 既免費行吓
大棍巴 2025-06-08 04:07:57
除左Deepseek以外,大部份model都差好遠
可以上OpenRouter開條key玩下,你就會明點解Claude可以咁貴都大把人爭住用
以直報怨 2025-06-08 12:11:15
我有用開70B 果個
我想用d 唔係thinking 既model
我用thinking model plan 完想Act 既時候用non thunking 出得快d
不過我都會聽你講再試吓
試埋個0528
多謝分享
何不採花?? 2025-06-08 12:14:46
chatgpt 同 Google 成日拒絕我d gen圖prompt
又唔係咩裸露變態野 都唔比

有無咩alternatives
野原新之肋 2025-06-08 12:21:33
大棍巴 2025-06-08 14:25:46
Deepseek V3/Qwen 3都有得set non thinking
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞