Leaderboard

On-device LLM performance rankings powered by Glicko-2

iPhone 17 Pro Max

iOS

Rank

Rating

1,987

±17 RD

Win Rate

97.0%

Conservative Rating

1,954

TG Rating

1,988

PP Rating

1,990

Matches

979

Record

950W – 29L

Models Tested

Model	TG Median (tok/s)	PP Median (tok/s)	TG Best	PP Best	Runs
gemma-3-1b-it.Q2_K	82.36	1097.30	83.59	1139.50	2
qwen2.5-1.5b-instruct.Q4_K_M	61.46	648.88	61.46	648.88	1
Qwen3-1.7B-Q4_K_M	40.82	315.69	52.00	586.66	2
qwen2.5-1.5b-instruct-q8_0	38.13	661.60	38.13	661.60	1
qwen2.5-3b-instruct-q5_k_m	27.32	281.01	27.91	291.56	9
gemma-2-2b-it-Q6_K	26.63	367.54	29.57	402.86	7
Qwen3.5-2B.Q8_0	24.45	488.58	24.45	488.58	1
Qwen3-VL-4B-Thinking-Q4_K_M	23.83	216.04	23.83	216.04	1
Qwen3-4B-Instruct-2507-Q4_K_M	23.82	223.93	23.82	223.93	1
Llama-3.2-3B-Instruct-Q6_K	23.43	281.22	23.82	296.95	5
qwen2.5-1.5b-instruct-fp16	21.54	660.04	21.54	660.04	1
Qwen3-4B.Q6_K	18.85	207.65	18.85	207.65	1
Phi-3.5-mini-instruct.Q4_K_M	17.33	162.98	24.30	221.95	2
Gemmasutra-Mini-2B-v1-Q6_K	16.10	198.76	17.21	373.69	2
SmolLM3-Q4_K_M	15.58	22.43	15.58	22.43	1
Qwen3-4B-Instruct-2507-Q5_K_S	15.57	187.96	15.57	187.96	1
Llama-3.2-8B-Instruct-Q3_K_M	14.96	117.36	14.96	117.36	1
Qwen3.5-2B-BF16	14.96	483.89	14.96	483.89	1
Qwen3-4B-Instruct-2507-UD-Q5_K_XL	14.68	207.90	14.68	207.90	1
Qwen3-4B-Instruct-2507-UD-Q6_K_XL	14.21	216.62	14.21	216.62	1
Qwen3.5-4B-IQ4_NL	14.05	180.92	14.21	185.05	2
Qwen_Qwen3-4B-Thinking-2507-Q8_0	14.03	215.31	14.03	215.31	1
Qwen_Qwen3-4B-Instruct-2507-Q8_0	13.78	214.16	13.78	214.16	1
Qwen3.5-4B-Q4_K_M	13.55	174.94	13.85	178.40	2
DeepSeek-R1-Distill-Qwen-7B-Q4_K_M	12.86	120.51	12.86	120.51	1
Ministral-3-8B-Instruct-2512-IQ4_XS	12.86	108.79	12.86	108.79	1
Qwen_Qwen3.5-4B-Q4_K_M	11.60	160.43	11.60	160.43	1
gemma-3-4b-it-Q4_K_M	10.94	19.11	10.94	19.11	1
qwen2.5-7b-instruct-q3_k_m	10.58	95.72	10.58	95.72	1
dolphin3.0-llama3.1-8b-q4_k_m	10.45	71.55	10.45	71.55	1
Llama3.3-8B-Instruct-Thinking-Heretic-Uncensored-Claude-4.5-Opus-High-Reasoning.i1-IQ4_XS	5.89	8.94	5.89	8.94	1
Meta-Llama-3.1-8B-Instruct-Q5_K_M	4.80	51.41	4.80	51.41	1
DeepSeek-R1-0528-Qwen3-8B-IQ4_NL	3.02	6.91	3.02	6.91	1

Head-to-Head Record

Opponent	Shared Models	W	L	Win Rate
iPhone 15 Pro vs	10	9	1	90%
Galaxy S24 Ultra vs	10	9	1	90%
iPhone 16 Pro vs	10	9	1	90%
iPhone 16 Pro Max vs	9	7	2	78%
iPhone 17 Pro vs	9	2	7	22%
Galaxy S25 Ultra vs	9	6	3	67%
iPhone 15 Pro Max vs	8	5	3	63%
REDMAGIC 9 Pro vs	8	8	0	100%
iPhone 17 vs	8	7	1	88%
iPhone 16 vs	8	8	0	100%
iPhone 12 Pro Max vs	7	7	0	100%
iPhone 14 Pro Max vs	7	7	0	100%
Pixel 6 vs	7	7	0	100%
Galaxy S23 Ultra vs	7	7	0	100%
OnePlus 13 vs	7	7	0	100%
Pixel 8 Pro vs	7	7	0	100%
Galaxy Z Fold7 vs	6	6	0	100%
iPhone 13 Pro Max vs	6	6	0	100%
Pixel 7 Pro vs	6	6	0	100%
Pixel 10 Pro vs	6	6	0	100%
iPhone 12 Pro vs	6	6	0	100%
iPad Pro 11 inch 5th Gen vs	6	1	5	17%
iPad Pro 11 inch 6th Gen vs	6	0	6	0%
iPhone 13 Pro vs	6	6	0	100%
iPad Pro 12.9 inch 5th Gen vs	6	6	0	100%
X200 Pro vs	6	6	0	100%
POCO F5 vs	6	6	0	100%
Xiaomi 14T vs	6	6	0	100%
Nothing Phone (1)vs	6	6	0	100%
Galaxy S22 Ultra vs	6	6	0	100%
Galaxy A55 5G vs	6	6	0	100%
Galaxy S23 vs	6	6	0	100%
Xiaomi 15 Ultra vs	6	5	1	83%
Pixel 9 Pro vs	6	6	0	100%
Pixel 9 Pro XL vs	6	6	0	100%
Pixel 8 vs	6	6	0	100%
Xiaomi 11T Pro vs	6	6	0	100%
Galaxy S20 FE vs	6	6	0	100%
Galaxy S25+vs	5	4	1	80%
Galaxy S25 vs	5	5	0	100%
Pixel 7 vs	5	5	0	100%
OnePlus 15 vs	5	5	0	100%
Galaxy Z Fold6 vs	5	5	0	100%
iPhone 17 Air vs	5	5	0	100%
X300 Pro vs	5	5	0	100%
Galaxy Note20 Ultra 5G vs	5	5	0	100%
Galaxy S24+vs	5	5	0	100%
iPhone 14 Pro vs	5	5	0	100%
OnePlus 11 5G vs	5	5	0	100%
iPad Air 11 inch 6th Gen vs	5	1	4	20%

1–50 of 271 rows

1 / 6

Performance by App Version

Model

ImprovedRegressed

Compare With

#1iPad Pro 11 inch 6th Gen #2iPad Pro 12.9 inch 7th Gen #3iPad Pro 11 inch 5th Gen #4iPad Pro 11 inch 4th Gen #5iPhone 17 Pro #7iPad Air 11 inch 6th Gen #8iPad Air 13 inch 6th Gen #9iPhone 16 Pro Max