Ternary Bonsai 4B

Ternary Bonsai 4B 860 MB

Chat 32K context · Requires Low+ tier device

PrismML's 1.58-bit ternary model — 4B-class intelligence in ~0.86 GB, ~9x smaller than fp16

MIN TIER
Low
SMALLEST QUANT
Q2 · 0.9 GB
CONTEXT WINDOW
32K tokens
PARAMETERS
4B
Quant File size Quality
Q2 0.9 GB
42%
Best quality
Runs on these devices (67)
💻
MacBook Air M4 16GB
macOS
Q2 · ~140 tok/s · 0.9 GB
Tight fit
💻
MacBook Air M3 16GB
macOS
Q2 · ~116 tok/s · 0.9 GB
Tight fit
💻
MacBook Air M2 8GB
macOS
Q2 · ~116 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M4 Pro 36GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Air M1 8GB
macOS
Q2 · ~79 tok/s · 0.9 GB
Tight fit
💻
MacBook Air M1 16GB
macOS
Q2 · ~79 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M1 16GB
macOS
Q2 · ~79 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M1 Pro 16GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M1 Pro 32GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M1 Max 32GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M1 Max 64GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M2 Pro 16GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M2 Pro 32GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M2 Max 32GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M2 Max 64GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M3 Pro 18GB
macOS
Q2 · ~174 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M3 Pro 36GB
macOS
Q2 · ~174 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M3 Max 36GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M3 Max 96GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
📱
iPhone 16 Pro 8GB
iOS
Q2 · ~55 tok/s · 0.9 GB
Tight fit
📱
Galaxy S25 Ultra 12GB
Android
Q2 · ~63 tok/s · 0.9 GB
Tight fit
📱
Galaxy S24 8GB
Android
Q2 · ~50 tok/s · 0.9 GB
Tight fit
📱
Pixel 9 Pro 16GB
Android
Q2 · ~55 tok/s · 0.9 GB
Tight fit
🎮
Steam Deck OLED 16GB
Linux
Q2 · ~102 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 4070) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 3060) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 4080) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 4090) 64GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🤖
Atom 1 32GB
Linux
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🤖
Atom 1 64GB
Linux
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🤖
Atom 1 128GB
Linux
Q2 · ~200 tok/s · 0.9 GB
Tight fit
📱
iPad Pro M4 16GB
iOS
Q2 · ~98 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M1 8GB
macOS
Q2 · ~79 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M1 16GB
macOS
Q2 · ~79 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M2 8GB
macOS
Q2 · ~116 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M2 Pro 16GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M2 Pro 32GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M4 16GB
macOS
Q2 · ~140 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M4 32GB
macOS
Q2 · ~140 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M4 Pro 24GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Mini M4 Pro 48GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Studio M4 Max 64GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Pro M2 Ultra 192GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
Snapdragon X Elite Laptop 16GB
Windows
Q2 · ~158 tok/s · 0.9 GB
Tight fit
📱
OnePlus 13 16GB
Android
Q2 · ~63 tok/s · 0.9 GB
Tight fit
💻
MacBook Air M2 16GB
macOS
Q2 · ~116 tok/s · 0.9 GB
Tight fit
💻
MacBook Air M3 8GB
macOS
Q2 · ~116 tok/s · 0.9 GB
Tight fit
🖥️
Mac Studio M1 Ultra 64GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Studio M2 Ultra 64GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Mac Studio M3 Ultra 96GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M4 Max 48GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M5 16GB
macOS
Q2 · ~178 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M5 Pro 24GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
💻
MacBook Pro M5 Max 48GB
macOS
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 4060) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 3070) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 3080) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 3090) 64GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 5070) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 5080) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RTX 5090) 64GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RX 7800 XT) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (RX 7900 XTX) 64GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (Arc B580) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🖥️
Gaming PC (Arc A770) 32GB
Windows
Q2 · ~200 tok/s · 0.9 GB
Tight fit
🍓
Raspberry Pi 5 8GB
Linux
Q2 · ~37 tok/s · 0.9 GB
Tight fit
📱
iPhone 15 6GB
iOS
Q2 · ~34 tok/s · 0.9 GB
Tight fit
Step-by-step run guides coming soon — check the apps above to get started today.