Qwen3 Omni 30B A3B (Reasoning) vs Grok 4.20 0309 v2 (Non-reasoning)

Alibaba vs xAI — side-by-side benchmark comparison

	Qwen3 Omni 30B A3B (Reasoning)	Grok 4.20 0309 v2 (Non-reasoning)
Intelligence Index	15.6	29.0
Coding Index	12.7	22.0
Math Index	74.0	—
Output speed (tok/s)	100.1	175.2
Blended price ($/1M)	$0.43	$3.00
Time to first token (s)	0.97s	0.47s
aime	—	—
aime 25	74.0%	—
artificial analysis coding index	12.70	22.00
artificial analysis intelligence index	15.60	29.00
artificial analysis math index	74.00	—
gpqa	72.6%	77.6%
hle	7.3%	24.2%
ifbench	43.4%	49.3%
lcr	0.0%	17.3%
livecodebench	67.9%	—
math 500	—	—
mmlu pro	79.2%	—
scicode	30.6%	32.8%
tau2	21.3%	59.9%
terminalbench hard	3.8%	16.7%

Benchmark data from Artificial Analysis.