GPT-4.1 vs Grok 4.20 0309 (Non-reasoning)

OpenAI vs xAI — side-by-side benchmark comparison

	GPT-4.1	Grok 4.20 0309 (Non-reasoning)
Intelligence Index	26.3	29.7
Coding Index	21.8	25.4
Math Index	34.7	—
Output speed (tok/s)	137.8	202.6
Blended price ($/1M)	$3.50	$3.00
Time to first token (s)	0.58s	0.50s
aime	43.7%	—
aime 25	34.7%	—
artificial analysis coding index	21.80	25.40
artificial analysis intelligence index	26.30	29.70
artificial analysis math index	34.70	—
gpqa	66.6%	78.5%
hle	4.6%	22.5%
ifbench	43.0%	47.8%
lcr	61.0%	18.0%
livecodebench	45.7%	—
math 500	91.3%	—
mmlu pro	80.6%	—
scicode	38.1%	32.2%
tau2	47.1%	69.6%
terminalbench hard	13.6%	22.0%

Benchmark data from Artificial Analysis.