Qwen 3.5 35B A3B

Qwen 3.5 35B A3B 20 GB

Chat 128K context · Requires Ultra+ tier device

Alibaba's sparse MoE — 35B total, 3B active per token, multimodal, 262K context

MIN TIER
Ultra
SMALLEST QUANT
Q2 · 12.0 GB
CONTEXT WINDOW
128K tokens
PARAMETERS
3B
Quant File size Quality
FP16 70.0 GB
100%
Best quality
Q8 37.0 GB
95%
Q6 27.0 GB
85%
Q5 24.0 GB
78%
Q4 20.0 GB
70%
Q3 15.0 GB
58%
Q2 12.0 GB
42%
Runs on these devices (42)
🖥️
Mac Studio M3 Ultra 96GB
macOS
Q8 · ~22 tok/s · 37.0 GB
Runs great
🖥️
Gaming PC (RTX 5090) 64GB
Windows
Q6 · ~66 tok/s · 27.0 GB
Tight fit
🖥️
Mac Pro M2 Ultra 192GB
macOS
FP16 · ~11 tok/s · 70.0 GB
Runs great
💻
MacBook Pro M3 Max 96GB
macOS
Q8 · ~11 tok/s · 37.0 GB
Runs great
🖥️
Gaming PC (RTX 4090) 64GB
Windows
Q4 · ~50 tok/s · 20.0 GB
Tight fit
🖥️
Gaming PC (RX 7900 XTX) 64GB
Windows
Q4 · ~48 tok/s · 20.0 GB
Tight fit
🖥️
Gaming PC (RTX 3080) 32GB
Windows
Q3 · ~51 tok/s · 15.0 GB
Tight fit
🖥️
Gaming PC (RTX 3090) 64GB
Windows
Q4 · ~47 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M5 Max 48GB
macOS
Q6 · ~22 tok/s · 27.0 GB
Runs well
💻
MacBook Pro M4 Max 48GB
macOS
Q6 · ~20 tok/s · 27.0 GB
Runs well
🖥️
Gaming PC (RTX 4080) 32GB
Windows
Q2 · ~60 tok/s · 12.0 GB
Tight fit
🖥️
Gaming PC (RTX 5080) 32GB
Windows
Q2 · ~80 tok/s · 12.0 GB
Tight fit
🖥️
Gaming PC (RX 7800 XT) 32GB
Windows
Q2 · ~52 tok/s · 12.0 GB
Tight fit
🖥️
Gaming PC (Arc A770) 32GB
Windows
Q2 · ~47 tok/s · 12.0 GB
Tight fit
🖥️
Gaming PC (RTX 5070) 32GB
Windows
Q4 · ~34 tok/s · 20.0 GB
Tight fit
🤖
Atom 1 64GB
Linux
Q8 · ~7 tok/s · 37.0 GB
Runs well
🤖
Atom 1 128GB
Linux
FP16 · ~4 tok/s · 70.0 GB
Runs well
🖥️
Mac Mini M4 Pro 48GB
macOS
Q6 · ~10 tok/s · 27.0 GB
Runs well
🖥️
Mac Studio M1 Ultra 64GB
macOS
Q8 · ~22 tok/s · 37.0 GB
Tight fit
🖥️
Mac Studio M2 Ultra 64GB
macOS
Q8 · ~22 tok/s · 37.0 GB
Tight fit
🖥️
Gaming PC (RTX 3070) 32GB
Windows
Q3 · ~30 tok/s · 15.0 GB
Tight fit
🖥️
Gaming PC (RTX 4070) 32GB
Windows
Q4 · ~25 tok/s · 20.0 GB
Tight fit
🖥️
Mac Studio M4 Max 64GB
macOS
Q8 · ~15 tok/s · 37.0 GB
Tight fit
🖥️
Gaming PC (Arc B580) 32GB
Windows
Q4 · ~23 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M1 Max 32GB
macOS
Q4 · ~20 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M1 Max 64GB
macOS
Q8 · ~11 tok/s · 37.0 GB
Tight fit
💻
MacBook Pro M2 Max 32GB
macOS
Q4 · ~20 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M2 Max 64GB
macOS
Q8 · ~11 tok/s · 37.0 GB
Tight fit
💻
MacBook Pro M3 Max 36GB
macOS
Q5 · ~17 tok/s · 24.0 GB
Tight fit
🖥️
Gaming PC (RTX 3060) 32GB
Windows
Q4 · ~18 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M5 Pro 24GB
macOS
Q3 · ~20 tok/s · 15.0 GB
Tight fit
💻
MacBook Pro M4 Pro 36GB
macOS
Q5 · ~11 tok/s · 24.0 GB
Tight fit
🖥️
Mac Mini M4 Pro 24GB
macOS
Q3 · ~18 tok/s · 15.0 GB
Tight fit
🖥️
Gaming PC (RTX 4060) 32GB
Windows
Q3 · ~18 tok/s · 15.0 GB
Tight fit
🤖
Atom 1 32GB
Linux
Q5 · ~9 tok/s · 24.0 GB
Tight fit
💻
MacBook Pro M1 Pro 32GB
macOS
Q4 · ~10 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M2 Pro 32GB
macOS
Q4 · ~10 tok/s · 20.0 GB
Tight fit
🖥️
Mac Mini M2 Pro 32GB
macOS
Q4 · ~10 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M3 Pro 36GB
macOS
Q5 · ~6 tok/s · 24.0 GB
Tight fit
🖥️
Mac Mini M4 32GB
macOS
Q4 · ~6 tok/s · 20.0 GB
Tight fit
💻
MacBook Pro M3 Pro 18GB
macOS
Q2 · ~13 tok/s · 12.0 GB
Tight fit
🎮
Steam Deck OLED 16GB
Linux
Q2 · ~7 tok/s · 12.0 GB
Tight fit
Step-by-step run guides coming soon — check the apps above to get started today.