Alibaba出左一系列Qwen 3 models

大棍巴

63 回覆

6 Like 7 Dislike

以直報怨 2025-05-15 16:55:51

依家最好既Multimodal open source model 係咩（主要image understanding 的話）？我試左gemma 3，啲人之前講到佢好勁，但實測好廢。

Mistral 同 QwQ 未試

DAN_DAN 2025-05-15 16:57:28

Gemma 3係勁在細模型可以係edge度run

absolute值佢唔係最強

以直報怨 2025-05-15 16:59:46

Gemma3 27B 今時今日都唔算好細喇
但都係同gemini 2同gpt-4o-mini 無得比

大棍巴 2025-05-15 17:03:18

用完Gemini 俾大context window縱壞哂，而家我連Claude都少用左。

啲library太大嘅時候，可以餵Gemini好正

大棍巴 2025-05-15 17:23:10

印象中啲人講Qwen 2.5 VL 72B認圖幾好。

以直報怨 2025-06-07 22:49:23

我試完mistral, gemma3, qwen 2 VL, qwen2.5 VL.
Qwen2.5 VL 贏成條街
不過佢72B 唔算公平比拼既

大棍巴 2025-06-07 23:16:03

可以試埋Qwen 2.5 VL 7B，好似都ok

以直報怨 2025-06-07 23:57:09

想試Qwen Coder 配Cline
暫時淨係覺得Sonnet 同Gemini勁
想搵個Local 既免費行吓

大棍巴 2025-06-08 04:07:57

除左Deepseek以外，大部份model都差好遠

可以上OpenRouter開條key玩下，你就會明點解Claude可以咁貴都大把人爭住用

以直報怨 2025-06-08 12:11:15

我有用開70B 果個
我想用d 唔係thinking 既model
我用thinking model plan 完想Act 既時候用non thunking 出得快d
不過我都會聽你講再試吓
試埋個0528
多謝分享

何不採花?? 2025-06-08 12:14:46

chatgpt 同 Google 成日拒絕我d gen圖prompt
又唔係咩裸露變態野都唔比

有無咩alternatives

野原新之肋 2025-06-08 12:21:33

大棍巴 2025-06-08 14:25:46

Deepseek V3/Qwen 3都有得set non thinking