Startseite / Technologie / KI–Infrastruktur: On–Premises oder Cloud – Was überzeugt?

KI–Infrastruktur: On–Premises oder Cloud – Was überzeugt?

Juni 17, 2024

Megan ClairmontExperte für IT-Sicherheit

Wenn es um den Aufbau und die Verwaltung von KI-Infrastrukturen geht, sehen sich Unternehmen heute zunehmend mit der Entscheidung konfrontiert, ob sie auf On-Premises-Lösungen setzen oder die Cloud nutzen sollen. Die jüngste Debatte wurde durch die Analyse von Sid Premkumar, dem Gründer des KI-Startups Lytix, neu entfacht. In einem detaillierten Blogpost vergleicht er die Kosten des Selbsthostings eines Open-Source-KI-Modells mit denen der Nutzung von Amazon Web Services (AWS). Seine Erkenntnisse, dass Selbsthosting die Kosten von einem Dollar pro Million Tokens auf nur einen Cent senken könnte, jedoch eine Amortisationszeit von etwa 5,5 Jahren erfordert, werfen ein neues Licht auf diese komplexe Thematik. Doch diese Rechnung berücksichtigt nicht alle Faktoren, insbesondere die Gesamtbetriebskosten (Total Cost of Ownership, TCO), die für eine umfassende Bewertung entscheidend sind.

Die Kosten-Nutzen-Relation von On-Premises vs. Cloud-Lösungen

Premkumars Analyse legt dar, dass Unternehmen mit dem Selbsthosting der Hardware und vier Nvidia Tesla T4-GPUs – mit einer Anfangsinvestition von etwa 3.800 USD und weiteren 1.000 USD für das restliche System – potenziell massive Kosteneinsparungen erreichen könnten. Doch nicht berücksichtigt wird dabei, dass eine ständige Maximierung der Hardwareauslastung in der Praxis selten gegeben ist. Zudem sind zusätzliche Kosten für Wartung, Upgrades und mögliche Ausfallzeiten in die TCO zu integrieren, Faktoren, die in einer Cloud-Umgebung von den Anbietern abgefedert werden.Ein weiterer Aspekt ist die Skalierbarkeit. Cloud-Lösungen erlauben es, Ressourcen dynamisch zu erhöhen oder zu verringern, je nach Bedarf. So können Spitzenauslastungen ohne vorherige Investition in zusätzliche Hardware gemeistert werden. Die operative Flexibilität, die mit Cloud-Computing einhergeht, ist ein nicht zu unterschätzender Vorteil, vor allem für Unternehmen mit variabler oder unsicherer Nutzung von KI-Workloads.

Der anfängliche Widerstand gegen Cloud-Computing

Noch vor nicht allzu langer Zeit war Cloud-Computing mit Skepsis behaftet und stieß auf Widerstand. Die Anhänger von On-Premises-Lösungen betonten die Aspekte der Kontrolle und Sicherheit sowie die Möglichkeit, durch lokale Infrastrukturen Kosten einzusparen. Sie hoben die verbesserte Leistung für latenzsensitive Aufgaben hervor und begrüßten die individuelle Anpassbarkeit, um sich nicht in Abhängigkeit von externen Anbietern zu begeben – ein als Vendor-Lock-in bekanntes Phänomen.Heute sind die Argumente zwar ähnlich, doch hat sich die Realität in Bezug auf die Verfügbarkeit, die Performance und die Sicherheit von Cloud-Computing grundlegend verändert. Der „Great Cloud Wars“ hat gezeigt, dass die Cloud-Dienste in diesen Bereichen mit On-Premises-Lösungen nicht nur mithalten, sondern sie häufig auch übertreffen können. Es ist die Agilität und Skalierbarkeit, die die Cloud für moderne Geschäftsbetriebe so attraktiv macht.

Die Überlegenheit der Cloud in Flexibilität und Fachexpertise

Das rasante Wachstum des Cloud-Computing-Markts hat dazu geführt, dass Cloud-Anbieter über umfassendes Fachwissen und eine Infrastruktur verfügen, die in ihrer Größe und Effizienz kaum von Einzelunternehmen erreicht werden kann. Insbesondere im Bereich der KI, wo spezialisierte Hardware mit hoher Rechenleistung benötigt wird, können viele Unternehmen die erforderlichen Investitionen nicht alleine stemmen.Cloud-Anbieter hingegen profitieren von Skaleneffekten und können somit leistungsstarke Ressourcen wie GPUs und TPUs zu wettbewerbsfähigeren Preisen anbieten. Darüber hinaus wird durch Partnerprogramme und Gemeinschaftsprojekte Expertise zugänglich gemacht, welche die Entwicklung und Implementierung von KI-Projekten beschleunigt und verbessert. Die Cloud befähigt nicht nur durch technologische Ressourcen, sondern auch durch das bereitgestellte Wissen und die damit verbundene Innovationskraft.

Finanzielle und technologische Herausforderungen der KI-Infrastruktur

KI-basierte Projekte erfordern hohe Anfangsinvestitionen – insbesondere in Form von spezialisierten Recheneinheiten wie den GPUs von Nvidia oder den TPUs von Google. Diese Hardwarekomponenten sind für ihre hohe Leistungsfähigkeit bekannt, stellen jedoch gerade kleinere Unternehmen vor finanzielle Herausforderungen. Beim Selbsthosting liegt das Risiko einer Fehlinvestition vollständig beim Unternehmen, und nicht zu vergessen ist auch der Aufwand für die laufende Aktualisierung und den Unterhalt der Systeme.Die Cloud hingegen ermöglicht es, auf eine modernste Infrastruktur zuzugreifen, ohne die volle wirtschaftliche Last einer eigenen KI-Infrastruktur tragen zu müssen. Dies ist besonders relevant in einem Bereich, der sich durch schnelle technologische Fortschritte charakterisiert und in dem Unternehmen ständig auf dem neuesten Stand der Technik bleiben müssen, um konkurrenzfähig zu sein. Darüber hinaus bieten Cloud-Dienste auch die notwendige Flexibilität, schnell auf Änderungen am Markt oder in den Anforderungen zu reagieren.

Datenschutz und Sicherheit in der KI-Cloud-Ära

In einer Welt, in der Datenschutz und Datensicherheit immer zentralere Rollen spielen, besonders im Zusammenhang mit sensiblen KI-Anwendungen, stellen sich neue Herausforderungen. Während On-Premises-Infrastrukturen theoretisch eine höhere Kontrolle über Daten bieten könnten, haben Cloud-Anbieter in den letzten Jahren ihre Sicherheitsprotokolle deutlich verstärkt und bieten Dienste an, die Datenschutz und Sicherheit in der Cloud gewährleisten.Nicht zuletzt müssen datenschutzrechtliche Bestimmungen eingehalten werden, die bei der Nutzung von Cloud-Infrastrukturen oftmals einfacher umzusetzen sind, da Cloud-Provider in der Regel umfangreiche Compliance-Rahmen bieten. Zudem sind fortschrittliche Lösungen wie Apples Private Compute Cloud Zeugnis dafür, dass in der Cloud auch die Privatsphäre der Nutzerdaten respektiert wird.

Edge Computing als potenzieller Vorteil von On-Premises-Lösungen

Ein zunehmend diskutiertes Thema ist das Edge Computing, das besondere Bedeutung für Anwendungen hat, bei denen es auf geringe Latenzzeiten ankommt. Es repräsentiert einen Bereich, in dem On-Premises-Lösungen einen Vorteil bieten könnten, da die Datenverarbeitung direkt am Entstehungsort erfolgt und nicht erst in entfernte Rechenzentren übertragen werden muss.Doch auch hier werden Fortschritte erzielt: Viele Cloud-Anbieter erweitern ihre Dienste um Edge-Funktionen und bringen durch Entwicklungen wie das Internet of Things (IoT) und mobiles Computing die Datenverarbeitung näher an den Nutzer. Somit werden auch latenzsensitive Anwendungen zunehmend cloud-kompatibel, wodurch die Grenzen zwischen On-Premises und Cloud weiter verschwimmen.

Fazit: Die voraussichtliche Dominanz der Cloud in KI-Infrastrukturen

Edge Computing gewinnt an Bedeutung in Bereichen, in denen niedrige Latenzzeiten entscheidend sind. Diese Technologie ermöglicht die Datenverarbeitung direkt am Ursprungsort, ohne dass Daten erst zu weit entfernten Rechenzentren geschickt werden müssen. Das hat den Vorteil, dass Informationen schneller verarbeitet werden können, was besonders bei zeitkritischen Anwendungen von Nutzen ist.Cloud-Anbieter sind jedoch nicht weit dahinter: Sie integrieren zunehmend Edge-Computing-Features in ihre Dienstleistungen. Durch die Einbeziehung von Trends wie dem Internet der Dinge (Internet of Things, IoT) und dem mobilen Computing wird die Datenverarbeitung nun auch außerhalb von On-Premises-Lösungen beschleunigt. Diese Entwicklungen tragen dazu bei, dass selbst Applikationen, die eine geringe Latenz erfordern, immer besser mit Cloud-Umgebungen harmonieren.Die klare Linie zwischen Datenverarbeitung vor Ort (On-Premises) und der Cloud beginnt sich zunehmend zu verwischen, da Cloud-Angebote durch Edge-Computing-Funktionalitäten erweitert werden. Die Brücke zwischen lokaler Verarbeitung und Cloud-basierter Verarbeitung wird somit stetig kürzer, was neue Möglichkeiten für eine Vielzahl von Anwendungen eröffnet, die schnelle Reaktionen und Echtzeit-Datenverarbeitung benötigen. Dadurch werden auch die Herausforderungen von latenzsensitiven Anwendungen bewältigt und die Effektivität dieser Anwendungen in der Cloud-Umgebung verbessert.