Wenn Apple neue Chips vorstellt, geht es normalerweise um dünnere Laptops und längere Akkulaufzeit. Bei den am 3. März angekündigten Prozessoren M5 Pro und M5 Max ist das anders: Zum ersten Mal hat Apple seine Laptop-Chips gezielt für den Einsatz von künstlicher Intelligenz umgebaut. Die neuen MacBook-Pro-Modelle sind seit dem 11. März erhältlich — und die Benchmarks (standardisierte Leistungstests) zeigen, warum die KI-Branche aufhorcht.
Was Apple gebaut hat — und warum es diesmal anders ist
Im Kern steckt eine grundlegend neue Architektur. Bisher fertigte Apple seine Pro- und Max-Chips als einzelnen Baustein. Die M5-Generation nutzt erstmals die sogenannte Fusion Architecture: Zwei separate Chip-Bausteine werden zu einem System verbunden — ähnlich wie AMD es bei seinen Serverprozessoren macht. Das erlaubt Apple, mehr Recheneinheiten unterzubringen, ohne die Fertigung unverhältnismäßig teuer zu machen.
Der eigentliche Durchbruch für KI-Anwendungen steckt aber in einer anderen Neuerung: Jeder einzelne Grafikkern enthält jetzt einen „Neural Accelerator" — einen spezialisierten Rechenbaustein, der auf die mathematischen Operationen optimiert ist, die KI-Modelle für ihre Berechnungen brauchen. Der M5 Max hat 40 Grafikkerne, also 40 dieser Beschleuniger, die parallel arbeiten.
Das Ergebnis: Die Zeit, bis ein KI-Modell seine erste Antwort liefert (die sogenannte „Time to First Token"), sinkt laut Apples eigenen Messungen um den Faktor 3,3 bis 4 im Vergleich zum Vorgänger M4. Eine Anfrage an ein großes Sprachmodell, die auf dem M4 Max noch 81 Sekunden dauerte, wird auf dem M5 Max in 18 Sekunden beantwortet.
128 GB Arbeitsspeicher: Warum das für KI entscheidend ist
Um zu verstehen, warum die M5-Chips für KI-Anwendungen besonders interessant sind, muss man wissen, wie KI-Modelle funktionieren: Sie bestehen aus Milliarden von Zahlenwerten (Parametern), die alle gleichzeitig im Arbeitsspeicher vorgehalten werden müssen. Je größer das Modell, desto mehr Speicher wird benötigt.
Der M5 Max bietet bis zu 128 GB gemeinsamen Arbeitsspeicher (Unified Memory) mit einer Übertragungsrate von 614 GB pro Sekunde. Das bedeutet: Ein KI-Modell mit 70 Milliarden Parametern — in komprimierter Form etwa 40 GB groß — passt vollständig in den Speicher des Laptops. Zum Vergleich: Die leistungsstärkste einzelne NVIDIA-Grafikkarte für Endverbraucher, die RTX 5090, hat nur 32 GB Speicher und müsste solche Modelle teilweise auf die langsamere Festplatte auslagern.
Der M5 Pro bietet bis zu 64 GB bei 307 GB/s — laut Apple genug für die meisten praktischen Unternehmens-Szenarien mit Modellen bis 30 Milliarden Parameter.
Was Unternehmen davon haben
Die Zahlen sind beeindruckend, aber die eigentliche Frage für Geschäftsführer lautet: Was ändert sich konkret?
Erstens: Datenschutz ohne Leistungsverzicht. Wer KI-Modelle lokal auf dem Laptop betreibt, schickt keine Unternehmensdaten an externe Server. Für Branchen wie Recht, Medizin oder Finanzen, in denen strenge Datenschutzregeln gelten, war das bisher ein Kompromiss — lokale Modelle waren deutlich langsamer als Cloud-Dienste. Mit dem M5 Max schrumpft dieser Abstand erheblich.
Zweitens: Unabhängigkeit von Cloud-Anbietern. Jede KI-Anfrage an einen Cloud-Dienst kostet Geld — pro Wortbaustein (Token), der verarbeitet wird. Wer KI-Modelle täglich im Geschäftsbetrieb einsetzt, kann mit einem M5-MacBook die laufenden Kosten auf null senken, sobald die Anschaffung bezahlt ist. Der M5 Pro startet bei 2.199 US-Dollar, der M5 Max bei 3.999 US-Dollar.
Drittens: Energieeffizienz. Ein M5 Max unter voller KI-Last verbraucht laut Popular Science zwischen 60 und 90 Watt. Ein vergleichbares NVIDIA-Desktop-System zieht das Zehn- bis Fünfzehnfache. Für Unternehmen mit Nachhaltigkeitszielen ist das ein relevanter Faktor.
Die Grenzen: Wo Cloud-KI weiterhin überlegen bleibt
Trotz des Leistungssprungs hat lokale KI auf dem Laptop klare Grenzen. Die neuesten und leistungsstärksten Modelle — etwa GPT-5.4 oder Claude Opus — laufen ausschließlich in der Cloud und sind zu groß für jedes Endgerät. Auch beim Durchsatz für kleine Modelle schlägt spezialisierte Server-Hardware den M5: Eine NVIDIA RTX 5090 erreicht bei kompakten Modellen über 200 Wortbausteine pro Sekunde, der M5 Max liegt bei etwa 95.
Der M5 ist deshalb kein Ersatz für Cloud-KI, sondern eine Ergänzung: für Prototypen, für vertrauliche Daten, für die Arbeit unterwegs — überall dort, wo Unabhängigkeit und Datenschutz wichtiger sind als maximale Geschwindigkeit.
Apples KI-Strategie wird klarer
Dass Apple beim neuen MacBook Pro demonstrativ die Open-Source-Software LM Studio auf dem Vorführbildschirm zeigte, war kein Zufall. Es ist ein Signal: Apple positioniert seine Hardware als die bevorzugte Plattform für Entwickler und Forscher, die KI-Modelle lokal betreiben wollen. Apples hauseigenes Softwarepaket MLX, das speziell für die Neural Accelerators optimiert ist, liefert laut Apples Machine-Learning-Team bis zu 3,5- bis 4-fache Beschleunigung bei der Erstantwort eines Modells.
Johny Srouji, Apples Chip-Chef, sprach von einem „monumentalen Sprung für Apple Silicon". Die Fusion Architecture sei die Grundlage für die nächsten Jahre. Für Unternehmen heißt das: Apple baut seine Chips nicht mehr nur für Kreativprofis — sondern zunehmend für eine Welt, in der KI-Verarbeitung auf jedem Arbeitsplatzrechner stattfindet.
Quellen
- Apple Newsroom — Offizielle Vorstellung des MacBook Pro mit M5 Pro und M5 Max (3. März 2026)
- Apple Newsroom — Technische Details zur Fusion Architecture und den Chip-Spezifikationen
- Apple Machine Learning Research — MLX-Benchmarks mit Neural Accelerators auf dem M5
- Popular Science — 10 Dinge über die neuen M5-Pro- und M5-Max-MacBook-Pros
- ModelFit — Detaillierte Analyse der M5-Chips für lokale KI-Modelle mit Vergleichstabellen