Qwen3要睇埋Aider先可以下定論
其中一個經常俾人用嘅benchmark係balls in hexagon test:
https://www.reddit.com/r/LocalLLaMA/s/FGy2QEyB1o
Qwen 嘅QwQ唔pass,我啱啱試Qwen3 30B-A3都唔work。有人試左200-A20個MoE都係唔work。一陣我可能試下Qwen3 32B dense。
Qwen堆model作為agent+local domain應該係幾好,但so far好似都冇能力去1-shot啲常見benchmark類問題。
近排好heat嘅另一隻係GLM-4 32B,啲人好似話佢強過Qwen2.5好多,我就仲未試。亦唔知同Qwen3比係點。