Lokalaise
Zurück Hardware

Apple Mac Studio.
Unser Standard-Setup.

Unser Software-Stack ist speziell für Apple Silicon optimiert. Die Unified Memory Architektur der Mac Studios ermöglicht es, große KI-Modelle direkt im gemeinsamen Speicher von CPU und GPU auszuführen — ohne die Engpässe klassischer Serverarchitekturen.

Warum Apple Silicon?

Herkömmliche KI-Server trennen CPU- und GPU-Speicher. Apple Silicon funktioniert anders — und unser Stack nutzt das voll aus.

Shared Memory

512 GBUnified Memory

Cluster bis 20 Studios

20×Skalierbar

120W statt 1.500W+

120WPro Einheit

Lautlos & kompakt

19 cmSeitenlänge

Hardware-Verschlüsselung

AESEncryption

Nativer Software-Stack

MetalAccelerated

Shared Memory — einfach erklärt

Bei klassischen Servern haben CPU und GPU jeweils eigenen Speicher. Daten müssen zwischen beiden kopiert werden. Das ist langsam und begrenzt die Modellgröße.

Klassischer Server

CPU-Speicher64 GB RAM
Daten kopieren ↕
GPU-Speicher24 GB VRAM

Modellgröße begrenzt durch GPU-VRAM

Apple Silicon (Mac Studio)

Unified Memorybis 512 GB
CPU
GPU
Neural Engine

Alle Einheiten nutzen denselben Speicher — kein Kopieren nötig

Clustering: Bis zu 20 Mac Studios als ein System

Unser Software-Stack verbindet bis zu 20 Mac Studios über Thunderbolt 5 zu einem einzigen KI-System. Die Geräte teilen ihren gesamten Speicher und arbeiten gemeinsam an Inferenz-Aufgaben — als wäre es eine Maschine.

Full-Mesh Thunderbolt 5

Jedes Gerät ist direkt mit jedem anderen verbunden — 6 Kabel, keine Switches

Mac Studio 1M3 Ultra · 512 GB
Mac Studio 2M3 Ultra · 512 GB
Mac Studio 3M3 Ultra · 512 GB
Mac Studio 4M3 Ultra · 512 GB

Beispiel: 4 von max. 20 Nodes · skalierbar bis 10 TB

= 2 TB Unified Cluster
VerbindungRDMA über Thunderbolt 5Direkter Speicherzugriff ohne OS-Umweg
Bandbreite80 Gbit/s bidirektionalBurst bis 120 Gbit/s pro Verbindung
Latenz< 50 µs99% Reduktion gegenüber TCP (300 µs)
TopologieFull-Mesh6 Kabel, kein Switch — jeder Mac erreicht jeden direkt
Modell-SplittingAutomatischModell wird aufgeteilt, alle Nodes inferieren synchron

Kosten

~€20.000

€35.000+

4× Mac Studio vs. Dual-GPU Server (RTX 6000 Pro)

Stromverbrauch

< 500W

1.500W

Unter Last, gesamter Cluster vs. Server

Latenz

< 50µs

~50µs

RDMA vs. InfiniBand

Was du bekommst

Vorkonfigurierter Mac Studio mit Lokalaise Software-Stack
Alle KI-Modelle vorinstalliert und optimiert
Einrichtung und Integration in dein Netzwerk
Die Hardware bleibt in unserem Eigentum — du zahlst eine monatliche Pauschale
Wartung, Updates und Support inklusive
Steht in deinem Serverraum — deine Daten verlassen nie dein Netzwerk
HARDWARE

Mac Studio Setup anfragen

Wir beraten dich, welche Konfiguration für dein Datenvolumen und deine Nutzerzahl optimal ist.