Qwen3.5 0.8B (Non-reasoning) vs Qwen3 30B A3B 2507 (Reasoning)

Alibaba vs Alibaba — side-by-side benchmark comparison

	Qwen3.5 0.8B (Non-reasoning)	Qwen3 30B A3B 2507 (Reasoning)
Intelligence Index	9.9	22.4
Coding Index	1.0	14.6
Math Index	—	56.3
Output speed (tok/s)	96.3	155.3
Blended price ($/1M)	$0.02	$0.67
Time to first token (s)	0.26s	1.02s
aime	—	90.7%
aime 25	—	56.3%
artificial analysis coding index	100.0%	14.60
artificial analysis intelligence index	9.90	22.40
artificial analysis math index	—	56.30
gpqa	23.6%	70.7%
hle	4.9%	9.8%
ifbench	21.6%	50.7%
lcr	6.7%	59.0%
livecodebench	—	70.7%
math 500	—	97.6%
mmlu pro	—	80.5%
scicode	2.9%	33.3%
tau2	65.2%	28.1%
terminalbench hard	0.0%	5.3%

Benchmark data from Artificial Analysis.