„Alle AI-Entwickler sind auf Mac umgestiegen?“ — Social-Media-Fazits fehlen meist Hardware zum gleichen Preis und API-Rechnungen in der Gesamtkostenrechnung. Im Juli 2026 testeten wir drei Maschinen à $1.199–$1.399 (US-UVP) eine Woche im selben Labor mit identischen AI-Workloads — Tabellen statt Stammeskrieg.
Drei prüfbare Fragen: ① Wie groß ist bei gleichem Budget der Unterschied bei lokalen LLMs / Agents? ② Wer ist über drei Jahre teurer mit Cloud-API, Abos und Remote-Mac? ③ Wann ist Windows noch die bessere Wahl?
1. Drei Referenzmaschinen: Specs und Straßenpreis
| Code | Modell | Kern-Specs | Preis (US MSRP Jul 2026) |
|---|---|---|---|
| A · Mac | MacBook Air 13" M4 | 10C CPU / 8C GPU, 16 GB Unified, 512 GB | $1.299 |
| B · Win dünn | Dell XPS 14 (9440) | Core Ultra 7 155H, 32 GB, 1 TB, Intel Arc iGPU | $1.249 |
| C · Win dGPU | Lenovo Legion Slim 5 | Ryzen 7 8845HS, 32 GB, 1 TB, RTX 4060 8 GB | $1.349 |
Fairness: B hat doppelten RAM; C kostet $50 mehr mit dGPU. Alle Lücken unter realer Kauf-Asymmetrie gemessen.
2. Testumgebung und AI-Workloads
- macOS 15.5 / Windows 11 24H2 (B, C mit WSL2)
- Ollama 0.9.2, MLX 0.25 (nur A), Cursor 1.2, Claude Code CLI 1.0.38
- Node 22 LTS, Python 3.12, Docker Desktop 4.42
- 24°C ±1°C, gleicher 27"-4K-Monitor
W1 lokale Inferenz · W2 Agent-Parallelität · W3 IDE-Vervollständigung · W4 Release-Kette (nur A lokal)
3. Lokale LLM-Leistung
| Metrik | A · M4 16GB | B · XPS 32GB | C · RTX 4060 |
| Llama 3.1-8B Q4 | 38,6 | 9,8 | 28,4 |
| TTFT | 1,2 s | 4,8 s | 2,1 s |
| Mistral 7B | 42,1 | 11,3 | 31,2 |
| Qwen2.5-Coder 7B | 36,8 | 10,5 | 26,9 |
| 14B Q4 | 18,2 | unbrauchbar | 22,6 |
| 100k Embeddings | 42 min | 126 min | 58 min |
| Lüfter/Leistung | lüfterlos ~12 W | 5200 RPM ~38 W | 4800 RPM ~95 W |
- A vs B: 8B-Durchsatz 3,9× XPS — Unified Memory + Metal.
- A vs C: RTX ~74 % bei 8B, 14B siegt C; 8× Leistung, Akku fast tot.
- MLX +8–12 %: MLX vs Ollama.
4. AI-Agent-Parallelität
| W2 | A | B | C |
| 6h Abschluss | 94 % | 61 % | 88 % |
| ollama stop | 0 | 4 | 1 |
| Swap-Peak | 3,8 GB | 52 GB | 8,1 GB |
| IDE-Freeze >30 s | 0 | 7 | 2 |
| Akku W2 | ✅ ~2,8 h | ❌ 45 min | ❌ Netzteil |
macOS 27 AMS: Neues macOS AI-Änderungen. Windows 11 Jul 2026: kein Äquivalent.
4.1 IDE-Latenz W3 P50
| Quelle | A | B | C |
| Cursor Tab | 380 ms | 395 ms | 410 ms |
| Ollama 7B | 210 ms | 890 ms | 340 ms |
5. Cloud-API vs. lokal: Break-even
| Ansatz | API/Monat | Hardware | Strom | Gesamt |
| Nur Cloud | $45–$68 | $36 | — | $81–$104 |
| A lokal 8B | $17 | $36 | $2 | ≈ $55 |
| B lokal 8B | $17 | $35 | $6 | ≈ $58 |
| C CUDA 8B | $17 | $37 | $9 | ≈ $63 |
Überschreitung >$25/Monat → M4 16GB ~14 Monate Amortisation. 2026 KI-Coding-Kosten-Ranking.
6. Build, Docker, IDE
| Szenario | A | B | C |
| Gradle cold | 4m 18s | 5m 31s | 4m 52s |
| cargo release | 3m 05s | 4m 12s | 3m 28s |
| Next.js 15 | 1m 48s | 1m 52s | 1m 44s |
| Docker 1 GB | 38s | 54s | 49s |
| Xcode Archive | 8m 42s | N/A | N/A |
iOS auf Windows: Windows iOS ohne Mac-Kauf. ~$480/Jahr Remote-Mac.
7. 3-Jahres-TCO: drei Profile
| Kosten | Profil 1 Cloud-Web | Profil 2 lokal LLM | Profil 3 iOS+AI |
| Hardware | $1.249–$1.349 | $1.299 | $1.299 |
| Abos 3 J. | $1.188 | $612 | $612 |
| API-Über 3 J. | $360 | $120 | $120 |
| Remote-Mac | $0 | $0 | B +$1.440 |
| TCO | ≈ $2.890–$3.080 | ≈ $2.055 | B ≈ $3.361 |
Profil 2: Mac spart ~$835, W2 +33 pp.
8. Wann RTX-4060-Windows gewinnt
| Szenario | Sieger |
| 14B+ netzbetrieben | C |
| CUDA / SD | C |
| AAA-Spiele | C 72 fps |
| Café + Akku 8B | A |
| Nacht-Agent leise | A |
9. Entscheidungsmatrix
| Wenn… | Empfehlung | TCO |
| Nur Cloud | Windows B | ≈ $2.900 |
| Lokal 8B + Agent | Air M4 16 GB | ≈ $2.050 |
| 14B + CUDA | Legion RTX 4060+ | ≈ $2.200 |
| Win + iOS | B + Remote-M4 | ≈ $3.360 |
10. TL;DR
| | A vs B | A vs C | Windows? |
| 8B | Mac 3,9× | Mac +36 % | iGPU nein |
| Agent | +33 pp | nah | 32 GB OOM |
| TCO | ~$835 | nah | Cloud ≈ gleich |
Fazit: Im $1.300-Ultrabook-Segment liefert M4 ~4× effektive lokale AI vs. iGPU-Windows und ~$800+ weniger über drei Jahre — CUDA oder reine Cloud: Windows bleibt rational.
Kein Budget für Mac #2? Zahlen in der Cloud prüfen
Profil 3: Win + Remote-Mac ~$1.300 mehr in 3 Jahren. M4 Mac Mini wöchentlich mieten für W4/W2. Macstripe · Lokaler KI-Agent auf M4 Mac Mini.
Häufig gestellte Fragen
Warum schlägt ein 32-GB-iGPU-Windows einen 16-GB-Mac?
KI-Inferenz hängt an der für die GPU erreichbaren Speicherbandbreite, nicht an der DDR-Nennkapazität. Intel Arc teilt Speicher mit der CPU; Ollama 8B auf dem XPS nur ~10 tok/s; M4 Unified Memory ~39 tok/s. Tabelle 3 im Artikel.
Ist ein RTX-4060-Windows im gleichen Budget besser für KI?
Aufgabenabhängig: C erreicht ~74 % von Mac bei 8B, gewinnt bei 14B; braucht aber Netzteil, ist laut, batteriebetrieben kaum nutzbar. Training/Gaming → C; Pendeln + lokales 8B + Agent → A.
Nur Cursor in der Cloud — ohne Mac?
Ja. W3: Cursor-Tab-P50-Unterschiede <8 %. Wer nie lokal inferiert und kein iOS macht: Profil 1 TCO über 3 Jahre Windows vs Mac <$200.
Wie wird die $835-Ersparnis im 3-Jahres-TCO berechnet?
Profil 2: Hardware $1.299 + Abos $612 + Überschreitungen $120 + Strom $24 = $2.055 vs Windows + hohe API ~$2.890. Hauptsächlich weniger Überschreitungen und niedrigere Claude/Cursor-Stufen.
Windows schon gekauft — günstigster Weg zu macOS?
Cloud-Mac nach Archive-Häufigkeit mieten: ≤2/Woche oft günstiger als Mac mini; ≥5/Woche Maschine A oder Monatsknoten. Kein Hackintosh/VM für Produktions-Releases.