MacBook Air M4 Benchmarks

BENCHMARK RESULTS (145)

Model	Quant	Measured	Estimated	RAM used	App	Source	Date
Whisper Tiny	Q8	249 tok/s	200 tok/s +25%	0.1 GB	Xybrid CLI	editorial	2026-03-15
Wav2Vec2 Base	Q8	237 tok/s	200 tok/s +19%	0.2 GB	Xybrid CLI	community	2026-03-27
🗣️ KittenTTS Nano	Q8	223 tok/s	200 tok/s +12%	0.1 GB	Xybrid CLI	community	2026-05-07
Whisper Tiny	FP16	219 tok/s	200 tok/s +10%	0.1 GB	MacWhisper	editorial	2026-02-22
🗣️ Kokoro 82M	FP16	217 tok/s	200 tok/s +9%	0.4 GB	Xybrid CLI	editorial	2026-02-09
Whisper Small	Q8	212 tok/s	200 tok/s +6%	0.3 GB	Xybrid CLI	community	2026-04-02
🗣️ Kokoro 82M	Q8	211 tok/s	200 tok/s +6%	0.3 GB	Xybrid CLI	community	2026-05-11
🔢 Nomic Embed Text	Q8	209 tok/s	200 tok/s +5%	0.2 GB	Xybrid CLI	editorial	2026-03-07
Ternary Bonsai 1.7B	Q2	205 tok/s	200 tok/s +3%	0.4 GB	Ollama	community	2026-01-05
🔢 all-MiniLM-L6-v2	Q8	205 tok/s	200 tok/s +3%	0.1 GB	Jan	community	2026-02-20
🔢 BGE Small	Q8	205 tok/s	200 tok/s +3%	0.1 GB	Jan	community	2026-02-20
SmolLM2 135M	Q8	204 tok/s	200 tok/s +2%	0.2 GB	LM Studio	editorial	2026-05-25
🗣️ KittenTTS Mini	Q8	201 tok/s	200 tok/s +1%	0.1 GB	Piper	editorial	2026-03-15
SmolLM2 135M	FP16	199 tok/s	200 tok/s +0%	0.3 GB	Jan	community	2026-04-21
🔢 all-MiniLM-L6-v2	FP16	192 tok/s	200 tok/s -4%	0.1 GB	Ollama	editorial	2026-05-28
🔢 BGE Small	FP16	192 tok/s	200 tok/s -4%	0.1 GB	Ollama	editorial	2026-01-28
🗣️ KittenTTS Nano	FP16	192 tok/s	200 tok/s -4%	0.1 GB	Piper	community	2026-02-06
Qwen 2.5 0.5B	Q8	185 tok/s	100 tok/s +85%	0.9 GB	Ollama	editorial	2026-02-20
Ternary Bonsai 1.7B	Q2	184 tok/s	200 tok/s -8%	0.5 GB	Jan	community	2026-04-02
🔢 GTE Large	Q8	184 tok/s	179 tok/s +3%	0.4 GB	LM Studio	editorial	2026-02-09
🗣️ KittenTTS Mini	FP16	183 tok/s	200 tok/s -8%	0.2 GB	Xybrid CLI	community	2026-04-08
Wav2Vec2 Base	FP16	183 tok/s	200 tok/s -8%	0.3 GB	MacWhisper	editorial	2026-04-20
Whisper Small	FP16	183 tok/s	200 tok/s -8%	0.6 GB	MacWhisper	editorial	2026-01-01
🔢 Nomic Embed Text	FP16	180 tok/s	200 tok/s -10%	0.3 GB	Jan	community	2026-05-15
🔢 GTE Large	FP16	158 tok/s	179 tok/s -12%	0.8 GB	Jan	community	2026-04-08
🗣️ OuteTTS 0.3 500M	Q8	145 tok/s	120 tok/s +21%	0.6 GB	Piper	community	2026-03-03
Ternary Bonsai 4B	Q2	142 tok/s	140 tok/s +1%	1.1 GB	Jan	community	2026-04-23
Ternary Bonsai 4B	Q2	142 tok/s	140 tok/s +1%	0.9 GB	Ollama	community	2026-02-09
🗣️ OuteTTS 0.3 500M	FP16	134 tok/s	120 tok/s +12%	1.1 GB	Xybrid CLI	community	2026-01-03
SmolLM2 360M	Q8	131 tok/s	130 tok/s +1%	0.7 GB	Jan	community	2026-05-12
SmolLM2 360M	FP16	123 tok/s	130 tok/s -5%	1.2 GB	Xybrid CLI	community	2026-03-26
Qwen 2.5 Coder 0.5B	Q8	112 tok/s	100 tok/s +12%	0.8 GB	LM Studio	editorial	2026-04-05
Qwen 2.5 0.5B	Q8	110 tok/s	100 tok/s +10%	0.8 GB	Xybrid CLI	community	2026-05-09
👁️ SmolVLM 500M	Q8	109 tok/s	109 tok/s +0%	0.8 GB	LM Studio	editorial	2026-04-20
Qwen 2.5 0.5B	FP16	108 tok/s	100 tok/s +8%	1.4 GB	Jan	community	2026-02-11
👁️ SmolVLM 500M	FP16	101 tok/s	109 tok/s -7%	1.4 GB	Jan	community	2026-02-21
Bonsai 8B (1-bit)	Q1	99 tok/s	103 tok/s -4%	1.5 GB	Ollama	editorial	2026-02-06
Gemma 3 1B	Q8	96 tok/s	55 tok/s +75%	1.5 GB	LM Studio	community	2026-02-22
Qwen 2.5 Coder 0.5B	FP16	96 tok/s	100 tok/s -4%	1.5 GB	Xybrid CLI	community	2026-01-19
Bonsai 8B (1-bit)	Q1	94 tok/s	103 tok/s -9%	1.5 GB	Jan	community	2026-03-25
Whisper Medium	Q8	94 tok/s	80 tok/s +18%	0.9 GB	Xybrid CLI	community	2026-01-01
🎙️ Distil-Whisper Large V3	Q8	94 tok/s	80 tok/s +18%	0.9 GB	Xybrid CLI	community	2026-05-25
🎙️ Distil-Whisper Large V3	FP16	88 tok/s	80 tok/s +10%	1.6 GB	MacWhisper	community	2026-03-05
Whisper Medium	FP16	87 tok/s	80 tok/s +9%	1.6 GB	MacWhisper	community	2026-04-09
🗣️ NeuTTS Air	Q8	85 tok/s	80 tok/s +6%	0.9 GB	Piper	community	2026-01-14
🗣️ NeuTTS Air	FP16	83 tok/s	80 tok/s +4%	1.7 GB	Xybrid CLI	community	2026-02-07
Whisper Large V3	Q8	78 tok/s	39 tok/s +100%	1.8 GB	MacWhisper	editorial	2026-03-12
Bonsai Image 4B	Q1	75 tok/s	67 tok/s +12%	1.3 GB	Ollama	community	2026-02-11
Ternary Bonsai 8B	Q2	74 tok/s	75 tok/s -1%	2.0 GB	Xybrid CLI	editorial	2026-01-17
Ternary Bonsai 8B	Q2	73 tok/s	75 tok/s -3%	1.9 GB	Jan	community	2026-05-24
Qwen 3.5 0.8B	Q8	72 tok/s	67 tok/s +7%	1.2 GB	Ollama	community	2026-03-16
Bonsai Image 4B	Q2	69 tok/s	67 tok/s +3%	2.0 GB	LM Studio	editorial	2026-05-12
Gemma 3 1B	Q8	66 tok/s	55 tok/s +20%	1.4 GB	Xybrid CLI	community	2026-01-01
Llama 3.2 3B	Q4	65 tok/s	18 tok/s +261%	2.1 GB	Jan	community	2026-03-10
🎨 Stable Diffusion Turbo	Q8	65 tok/s	57 tok/s +14%	1.3 GB	Xybrid CLI	community	2026-04-04
Qwen 3.5 0.8B	FP16	64 tok/s	67 tok/s -4%	2.3 GB	LM Studio	editorial	2026-01-02
TinyLlama 1.1B	Q8	63 tok/s	55 tok/s +15%	1.5 GB	Jan	community	2026-05-28
LFM2.5 1.2B	Q8	59 tok/s	51 tok/s +16%	1.4 GB	LM Studio	editorial	2026-05-09
Phi-4 Mini	Q4	58 tok/s	15 tok/s +287%	2.4 GB	LM Studio	editorial	2026-02-20
🎨 Stable Diffusion Turbo	FP16	56 tok/s	57 tok/s -2%	2.3 GB	Ollama	community	2026-01-03
TinyLlama 1.1B	FP16	55 tok/s	55 tok/s +0%	2.8 GB	LM Studio	editorial	2026-02-27
Gemma 3 1B	FP16	54 tok/s	55 tok/s -2%	2.4 GB	Ollama	community	2026-02-06
LFM2.5 1.2B	FP16	51 tok/s	51 tok/s +0%	2.9 GB	Xybrid CLI	editorial	2026-02-23
Llama 3.2 1B	Q8	50 tok/s	44 tok/s +14%	1.8 GB	LM Studio	editorial	2026-04-07
StableLM 2 1.6B	Q8	45 tok/s	36 tok/s +25%	2.3 GB	Xybrid CLI	community	2026-02-03
Whisper Large V3	Q8	44 tok/s	39 tok/s +13%	2.0 GB	Xybrid CLI	community	2026-05-28
Llama 3.2 1B	FP16	43 tok/s	44 tok/s -2%	3.3 GB	Xybrid CLI	community	2026-01-21
Whisper Large V3	FP16	43 tok/s	39 tok/s +10%	3.4 GB	MacWhisper	community	2026-03-02
Qwen 2.5 Coder 1.5B	Q8	42 tok/s	38 tok/s +11%	1.8 GB	Ollama	community	2026-02-06
🗣️ Dia 1.6B	FP16	40 tok/s	36 tok/s +11%	4.1 GB	Xybrid CLI	editorial	2026-04-19
🧠 DeepSeek R1 Distill 1.5B	FP16	38 tok/s	36 tok/s +6%	3.9 GB	Ollama	community	2026-02-19
Qwen 2.5 Coder 1.5B	FP16	38 tok/s	38 tok/s +0%	4.0 GB	Jan	community	2026-04-20
SmolLM2 1.7B	Q8	38 tok/s	35 tok/s +9%	1.9 GB	Ollama	community	2026-01-05
🧠 DeepSeek R1 Distill 1.5B	Q8	37 tok/s	36 tok/s +3%	2.3 GB	LM Studio	editorial	2026-04-21
👁️ Moondream 2B	Q8	37 tok/s	32 tok/s +16%	2.5 GB	LM Studio	editorial	2026-01-22
🗣️ Dia 1.6B	Q8	37 tok/s	36 tok/s +3%	2.2 GB	Xybrid CLI	community	2026-02-20
SmolLM2 1.7B	FP16	34 tok/s	35 tok/s -3%	4.2 GB	Jan	community	2026-04-19
Qwen 3.5 2B	Q8	34 tok/s	29 tok/s +17%	2.4 GB	Xybrid CLI	community	2026-01-04
StableLM 2 1.6B	FP16	33 tok/s	36 tok/s -8%	4.3 GB	LM Studio	editorial	2026-01-02
👁️ Moondream 2B	FP16	30 tok/s	32 tok/s -6%	4.4 GB	Ollama	community	2026-04-20
🎨 Stable Diffusion 3.5 Medium	FP16	29 tok/s	26 tok/s +12%	5.7 GB	Ollama	community	2026-02-23
Gemma 4 E2B	Q8	29 tok/s	27 tok/s +7%	2.7 GB	Ollama	community	2026-01-01
🎨 Stable Diffusion 3.5 Medium	Q8	28 tok/s	26 tok/s +8%	3.5 GB	LM Studio	editorial	2026-05-25
Gemma 4 E2B	FP16	27 tok/s	27 tok/s +0%	4.9 GB	Xybrid CLI	community	2026-04-02
Qwen 3.5 2B	FP16	26 tok/s	29 tok/s -10%	4.7 GB	Jan	community	2026-04-06
Qwen 2.5 Coder 3B	Q8	23 tok/s	19 tok/s +21%	3.8 GB	Xybrid CLI	community	2026-01-04
👨‍💻 StarCoder2 3B	Q8	22 tok/s	19 tok/s +16%	3.8 GB	Ollama	community	2026-01-04
Qwen 2.5 Coder 3B	FP16	21 tok/s	19 tok/s +11%	7.0 GB	Jan	community	2026-05-12
👨‍💻 DeepSeek Coder 6.7B	Q6	21 tok/s	17 tok/s +24%	6.4 GB	Ollama	community	2026-02-21
Qwen 2.5 3B	Q8	20 tok/s	19 tok/s +5%	4.4 GB	Jan	community	2026-02-22
Llama 3.2 3B	Q8	20 tok/s	18 tok/s +11%	4.6 GB	Jan	community	2026-05-25
Llama 3.2 3B	FP16	19 tok/s	18 tok/s +6%	8.5 GB	Ollama	editorial	2026-04-05
👨‍💻 StarCoder2 3B	FP16	19 tok/s	19 tok/s +0%	6.7 GB	LM Studio	community	2026-05-11
🎨 SDXL Turbo	Q8	19 tok/s	18 tok/s +6%	4.9 GB	Jan	community	2026-03-27
Phi-4 Mini	Q8	18 tok/s	15 tok/s +20%	5.2 GB	Jan	community	2026-02-11
Qwen 2.5 3B	FP16	17 tok/s	19 tok/s -11%	8.1 GB	LM Studio	editorial	2026-04-21
🎨 SDXL Turbo	FP16	17 tok/s	18 tok/s -6%	6.8 GB	Ollama	community	2026-02-07
Gemma 3n E4B	Q6	17 tok/s	16 tok/s +6%	7.5 GB	Ollama	community	2026-03-14
Qwen 2.5 7B	Q6	17 tok/s	15 tok/s +13%	6.5 GB	LM Studio	editorial	2026-05-11
Qwen 3.5 4B	Q8	17 tok/s	15 tok/s +13%	5.3 GB	Ollama	community	2026-04-22
Mistral 7B	Q6	17 tok/s	15 tok/s +13%	7.4 GB	Ollama	community	2026-03-17
🧠 DeepSeek R1 Distill 8B	Q6	17 tok/s	14 tok/s +21%	7.4 GB	Xybrid CLI	community	2026-05-23
Phi-4 Mini	FP16	16 tok/s	15 tok/s +7%	9.1 GB	Ollama	community	2026-05-11
👨‍💻 DeepSeek Coder 6.7B	Q8	16 tok/s	17 tok/s -6%	9.0 GB	LM Studio	editorial	2026-01-01
👁️ LLaVA 1.6 7B	Q8	16 tok/s	16 tok/s +0%	9.1 GB	Xybrid CLI	community	2026-01-17
Llama 3.1 8B	Q6	16 tok/s	14 tok/s +14%	7.8 GB	Jan	community	2026-05-28
🧠 Qwen3 8B	Q6	16 tok/s	14 tok/s +14%	7.1 GB	Jan	community	2026-02-10
Qwen 2.5 Coder 7B	Q6	16 tok/s	15 tok/s +7%	7.3 GB	Ollama	community	2026-03-14
👁️ LLaVA 1.6 7B	Q6	16 tok/s	16 tok/s +0%	6.3 GB	LM Studio	editorial	2026-03-14
Qwen 2.5 VL 7B	Q6	16 tok/s	14 tok/s +14%	6.6 GB	LM Studio	community	2026-02-23
Gemma 3n E4B	Q8	15 tok/s	16 tok/s -6%	8.8 GB	Xybrid CLI	community	2026-05-13
Qwen 2.5 7B	Q8	15 tok/s	15 tok/s +0%	9.0 GB	Ollama	community	2026-02-10
LFM2.5 8B A1B	Q8	15 tok/s	14 tok/s +7%	10.5 GB	Jan	community	2026-03-16
Mistral 7B	Q8	15 tok/s	15 tok/s +0%	10.3 GB	LM Studio	editorial	2026-02-25
🧠 DeepSeek R1 Distill 8B	Q8	15 tok/s	14 tok/s +7%	10.1 GB	LM Studio	community	2026-01-15
Qwen 2.5 Coder 7B	Q8	15 tok/s	15 tok/s +0%	10.0 GB	LM Studio	community	2026-02-22
Mistral Nemo 12B	Q5	15 tok/s	13 tok/s +15%	10.2 GB	Xybrid CLI	community	2026-01-03
🧠 DeepSeek R1 Distill 7B	Q6	15 tok/s	15 tok/s +0%	6.8 GB	LM Studio	editorial	2026-02-10
🎨 FLUX.1 Schnell	Q5	15 tok/s	13 tok/s +15%	9.1 GB	LM Studio	editorial	2026-01-15
Llama 3.1 8B	Q8	14 tok/s	14 tok/s +0%	10.8 GB	LM Studio	editorial	2026-02-27
Qwen 3.5 4B	FP16	14 tok/s	15 tok/s -7%	10.0 GB	Xybrid CLI	community	2026-01-21
🧠 DeepSeek R1 Distill 7B	Q8	14 tok/s	15 tok/s -7%	9.4 GB	Xybrid CLI	community	2026-01-19
🧠 Qwen3 8B	Q8	14 tok/s	14 tok/s +0%	9.7 GB	Xybrid CLI	editorial	2026-03-01
Qwen 2.5 VL 7B	Q8	14 tok/s	14 tok/s +0%	10.6 GB	Jan	community	2026-01-02
Gemma 3n E2B	Q8	14 tok/s	13 tok/s +8%	6.1 GB	Xybrid CLI	community	2026-03-27
Gemma 3 4B	Q8	14 tok/s	13 tok/s +8%	5.3 GB	Ollama	community	2026-02-06
Gemma 3 12B	Q5	14 tok/s	13 tok/s +8%	9.9 GB	LM Studio	community	2026-04-10
Gemma 4 E4B	Q8	14 tok/s	13 tok/s +8%	5.4 GB	LM Studio	community	2026-05-25
Qwen 3.5 9B	Q6	14 tok/s	12 tok/s +17%	7.6 GB	LM Studio	editorial	2026-02-26
LFM2.5 8B A1B	Q6	14 tok/s	14 tok/s +0%	7.3 GB	Ollama	editorial	2026-02-11
Gemma 3 4B	FP16	13 tok/s	13 tok/s +0%	9.6 GB	Xybrid CLI	community	2026-04-07
🎨 FLUX.1 Schnell	Q6	13 tok/s	13 tok/s +0%	10.7 GB	Jan	community	2026-03-14
Gemma 4 26B A4B	Q2	13 tok/s	12 tok/s +8%	10.7 GB	LM Studio	community	2026-01-04
Phi-4 Medium	Q5	13 tok/s	11 tok/s +18%	10.6 GB	Jan	community	2026-02-07
Gemma 3n E2B	FP16	12 tok/s	13 tok/s -8%	10.1 GB	Jan	community	2026-05-13
Gemma 3 12B	Q6	12 tok/s	13 tok/s -8%	12.0 GB	Xybrid CLI	editorial	2026-05-24
Mistral Nemo 12B	Q6	12 tok/s	13 tok/s -8%	10.8 GB	Ollama	community	2026-03-05
Gemma 4 E4B	FP16	12 tok/s	13 tok/s -8%	11.4 GB	Xybrid CLI	community	2026-04-04
Gemma 4 26B A4B	Q2	12 tok/s	12 tok/s +0%	11.3 GB	Ollama	community	2026-02-09
Qwen 3.5 9B	Q8	12 tok/s	12 tok/s +0%	11.6 GB	Jan	community	2026-05-24
Phi-4 Medium	Q6	12 tok/s	11 tok/s +9%	12.2 GB	LM Studio	editorial	2026-05-08
Gemma 4 31B	Q2	10 tok/s	11 tok/s -9%	13.3 GB	Xybrid CLI	editorial	2026-05-24
👨‍💻 Laguna XS.2	Q2	10 tok/s	11 tok/s -9%	13.9 GB	LM Studio	editorial	2026-04-21
Gemma 4 31B	Q2	10 tok/s	11 tok/s -9%	11.8 GB	LM Studio	editorial	2026-02-10
👨‍💻 Laguna XS.2	Q2	10 tok/s	11 tok/s -9%	13.9 GB	Jan	community	2026-02-22

← All benchmarks

MacBook Air M4 16GB