Qwen3.6 35B A3B (Non-reasoning) vs Grok 4.20 0309 v2 (Non-reasoning)

Alibaba vs xAI — side-by-side benchmark comparison

	Qwen3.6 35B A3B (Non-reasoning)	Grok 4.20 0309 v2 (Non-reasoning)
Intelligence Index	31.5	29.0
Coding Index	17.6	22.0
Math Index	—	—
Output speed (tok/s)	169.5	175.2
Blended price ($/1M)	$0.84	$3.00
Time to first token (s)	1.47s	0.47s
aime	—	—
aime 25	—	—
artificial analysis coding index	17.60	22.00
artificial analysis intelligence index	31.50	29.00
artificial analysis math index	—	—
gpqa	81.7%	77.6%
hle	12.5%	24.2%
ifbench	36.2%	49.3%
lcr	56.7%	17.3%
livecodebench	—	—
math 500	—	—
mmlu pro	—	—
scicode	1.3%	32.8%
tau2	85.1%	59.9%
terminalbench hard	25.8%	16.7%

Benchmark data from Artificial Analysis.