Warum alle auf Chips versessen sind, was DeepSeek besonders macht und ob es in den USA und China nun zu einem KI-Aufrüsten kommt, erklärt Janik Meisinger, Biomedical Engineer und Experte für KI aus linker Perspektive.
600 Milliarden Dollar. Mehr als die gesamte Jahreswirtschaftsleistung Österreichs innerhalb weniger Stunden – einfach verpufft. Das passierte mit dem Aktienwert des US-Chipkonzerns Nvidia, dem davor wertvollsten Unternehmen der Welt und Produzent der Chips, die ChatGPT ermöglicht haben. Der Grund? Das von einem privaten chinesischen Hedgefonds finanzierte Start-Up DeepSeek präsentiert DeepSeek R1, ihr neuestes LLM (Large Language Model).
Technische Einführung – was sind LLMs und warum brauchen sie Chips?
Ein Large Language Model ist ein bisschen wie die Autovervollständigungsfunktion. Es generiert Text, ohne zunächst zu wissen, was es „sagen“ wird. Dafür nimmt es einen Input und rechnet sich Wort für Wort aus, welches nächste Wort am Wahrscheinlichsten ist, je nach den Daten mit denen es trainiert wurde. „Training“ heißt hier auszurechnen, welche Werte die Milliarden Parameter der LLMs annehmen müssen, um auf die Inputs möglichst gut reagieren zu können. Doch es braucht gigantische Rechenleistungen für viele parallel laufende Rechenoperationen und sehr viel Strom, damit das Training möglichst bald abgeschlossen ist. Denn natürlich wollen alle schneller sein, als die Konkurrenz. Und dafür werden leistungsstarke Chips benötigt.
Besonders gut dafür eignen sich GPUs (Grafikprozessoren). Marktführer in dieser Branche ist Nvidia. GPUs kamen früher primär beim Rendern von Videospielen zum Einsatz, doch da in den letzten Jahren immer mehr Anwendungen für GPUs gefunden wurden, etwa auch das Minen von Kryptowährungen, stieg Nvidia letztes Jahr zum wertvollsten Unternehmen der Welt auf. Sein momentan leistungsstärkster Chip ist der 2022 erschienene H100. Er kostet zirka 35.000 Euro pro Stück und die führenden KI-Unternehmen besitzen zehntausende davon.
Wie DeepSeek die Konkurrenz überholte
Eigentlich sollten chinesische Unternehmen bei der Entwicklung von LLMs einen großen Nachteil haben. Denn im Zuge des Handesstreits mit China verhängte Präsident Biden 2022 Exportbeschränkungen über den H100 und andere Nvidia-Chips. Die großen US-Tech-Konzerne waren überzeugt, dass China in der KI-Branche ohne diese Chips kein Konkurrent werden könne. Wie im kalten Krieg glaubte man, den anderen technisch überlegen zu sein – und lag damit nicht nur falsch, sondern stärkte den Rivalen sogar.
Das liegt auch am „Wirth’schen Gesetz“ der Informatik: Mit steigender Leistung der Hardware wird Software immer schlechter optimiert. Während in den 80er-Jahren jedes Programm meisterhaft optimiert war, da Speicher und Rechenleistung stark beschränkt waren, ist Software heute oft viel zu groß und führt unnötige Rechenoperationen durch. DeepSeek musste durch die Exportbeschränkung viel effizienter arbeiten, hat so einen Meilenstein in Ressourceneffizienz gesetzt und sich ein Vermögen gespart. DeepSeek R1 ist zwar nicht besser als andere KI-Modelle – bei Tests schneidet es ähnlich gut ab wie die Konkurrenz – aber eben gleich gut, mit deutlich kleinerem Ressourceneinsatz. DeepSeek verwendete eine geringere Anzahl an Chips, und weniger leistungsstarke. So wurde viel Strom und sehr viel Geld gespart. Das Training von DeepSeek R1 kostete ein Zwanzigstel dessen, was das Training von vergleichbaren Modellen kostet.
Open Source – Schock für die Börse
Ebenfalls besonders an DeepSeek R1 ist, dass es unter der MIT-Lizenz herausgebracht wurde, also völlig Open Source ist. Alle können Quellcode und Parameter des Modells herunterladen und damit machen, was sie wollen, sogar in eigener Software verwenden. Das steht im starken Kontrast zu den KIs der großen Player, die alle sehr erpicht darauf sind, ihre Modelle für sich zu behalten. Die Vorherrschaft der großen KI-Player kommt so ins Wanken, denn für viele kleine Unternehmen und Forschungseinrichtungen ist diese Technologie nun in Reichweite gelangt. Sie können künftig mit einem vergleichbar kleinen Budget von 100.000 Euro ebenso LLMs trainieren.
Für die großen US-KI-Unternehmen ein Schock für die Profite: Chat-GPT verdiente 2024 mit kostenpflichtigen Abos vier Milliarden US-Dollar. Doch die Open Source Lizenz bedroht auch die Börsenwerte. Der Aktienkurs von KI-Unternehmen ist vor allem so hoch, weil erwartet wird, dass die KI in Zukunft überall eine zentrale Rolle spielt und der Marktführer der gesamten Wirtschaft einen Preis diktieren können wird. Zunächst war primär Nvidia betroffen und hat 17 Prozent seines Börsenwerts eingebüßt, denn der basiert auf seinem Monopol in der Chip-Industrie. Dass DeepSeek ohne Nvidia auskam, drückte den Kurs. In weiterer Folge waren die meisten Tech-Unternehmen betroffen, kritisch für die USA, wo sie heute ein Hauptwirtschaftsfaktor sind.
Mittlerweile hat der Kurs sich wieder erholt. Viele Unternehmen haben ihren pre-DeepSeek-Wert bereits wieder erreicht. Auch Nvidia, obwohl es nun nur das zweitwertvollste Unternehmen der Welt ist, hinter Apple. Der Wert von Unternehmen ergibt sich primär daraus, was sie in Zukunft liefern könnten. Ein wirklicher Crash wäre, wenn die KI-Blase endgültig platzt, also wenn es offensichtlich würde, dass KI-Technologie doch nicht so profitabel ist, wie von den Investoren vermutet. Nvidias H100-Chips werden auch in Zukunft gebraucht, sie werden in der nächsten Generation nur effizienter sein, bessere Resultate liefern und LLMs schneller trainieren können. Und KI-Unternehmen werden DeepSeeks Methoden analysieren und übernehmen.
Alles Made in China – das Ende des Westens?
Chinesische Produkte sind schon lange nicht aus unserem Alltag wegzudenken, nun gilt das auch für Technologie – mit DeepSeek R1 reiht sich die KI neben Mobilität und erneuerbare Energie als Branche ein, in der China weltweit führend ist. Auch in Telekommunikation: Die App RedNote, benannt nach Maos „kleinem roten Buch“, kam wie aus dem Nichts. Nun, dank millionenfacher Downloads von TikTok-Refugees, ist es die meist-heruntergeladene App der USA.
Technologische Dominanz und kulturelle Dominanz hängen stark zusammen, hängen aber auch von der wirtschaftlichen Stärke eines Landes ab. China ist seit längerer Zeit wirtschaftlich im Aufschwung und so wie zuvor schon Japan oder Südkorea nach deren wirtschaftlichem Aufstieg beginnt nun auch der Export kultureller Güter – wie früher mit japanischen Zeichentrickserien und Computerspielen oder K-Pop und K-Dramas. In diesen Beispielen war das gleichzeitig mit dem Export elektronischer Konsumprodukte passiert, interessanterweise bei China ebenso.
Der Unterschied zu Japan oder Südkorea ist, dass China kein Verbündeter des Westens ist. Das macht es für die globale Hegemonie des Westens zur Herausforderung, wenn China kulturell an Einfluss gewinnt, denn das könnte auch ideologische Auswirkungen und sogar in zukünftigen Konflikten eine Rolle spielen. Durch Zensurmaßnahmen kann dieser Einfluss auch klein gehalten werden – chinesische Apps oder Elektroautos führen nicht gleich zum Untergang des Westen; hier kommt wieder die Wirtschaft ins Spiel: Wie viel China aus diesem Einfluss machen kann, hängt stark davon ab, wie gut man auch wirtschaftlich mit dem Westen konkurrieren kann.
Die Geopolitik von Chips
Momentan bieten die USA alle möglichen Geldmittel auf, um den KI-Wettkampf gegen China zu gewinnen, teils auch an Staatsinteressen vorbei und über das Notwendige hinaus. Der Wettkampf in der KI-Branche ist geopolitisch aber auch höchst brisant. Die chinesische technologische Dominanz ist nicht nur ein Indiz für die Verschiebung der globalen Machtverhältnisse, sondern könnte auch als Katalysator zukünftiger Konflikte dienen. Ein potentieller Konflikt hängt sogar sehr stark mit der KI-Branche zusammen: Nvidia ist zwar ein US-amerikanisches Unternehmen, produziert aber, wie die meisten Unternehmen, die Chips entwerfen, die Chips nicht selbst, sondern lässt sie von unabhängigen Chipfabriken herstellen. Der größte Chiphersteller weltweit, der auch als einziger den H100 und andere Nvidia-Chips herstellt, ist TSMC (Taiwan Semiconductor Manufacturing Company) und hat wie viele andere Chiphersteller seinen Hauptsitz und den Großteil der Fabriken in Taiwan.
Da China von vielen Handelsbeschränkungen betroffen ist und die eigene Halbleiterindustrie noch einige Jahre im Rückstand ist, wäre ein Zugang zu taiwanesischen Chipfabriken von großem Interesse. Für die Volksrepublik China ist Taiwan Teil ihres Staatsgebiets und viele Militärexpert:innen schätzen, dass es in den nächsten Jahren zu einer militärischen Wiedervereinigung kommen könnte. Auf die Chipindustrie und damit auf die Weltwirtschaft hätte das enorme Folgen.
Chips und KI sind geopolitisch auch für militärische Macht relevant. Obwohl sie im Moment noch nicht im großen Stil eingesetzt werden, gibt es viele Anwendungsfälle. Im Ukraine-Konflikt zeigt sich die nun zentrale Rolle von drohnenbasierter Kriegsführung. Eine KI-gesteuerte Drohne würde viele Nachteile beseitigen: speziell ausgebildete Menschen müssen nahe an die Front gebracht werden, da größere Entfernungen durch den Einsatz von Störsignalen riskant sind. Auch zum Beispiel in Signalerkennung, Cyber-Kriegsführung und Logistik könnte KI eingesetzt werden.
Die großen US-Rüstungsunternehmen und neue KI-Rüstungsunternehmen arbeiten bereits daran. Peter Thiels Palantir (nach Herr der Ringe), entwickelt eine KI-basierte mobile Station für die Lenkung von Langstreckenraketen mit höherer Präzision als herkömmliche Stationen. Völlig unabhängig testet Anduril, auch nach „Herr der Ringe“ benannt, KI-Drohnen. In China kooperieren Huawei und das chinesische Militär für die Produktion vollautonomer Drohnen. Was sich nach „KI-Wettrüsten“ anhört, wird vermutlich jedoch keine militärischen Ausmaße vergleichbar mit dem nuklearen Wettrüsten annehmen. Eine überlegene KI bietet strategische Vorteile, zumindest auf absehbare Zeit werden Faktoren wie die Wirtschaftsleistung der Schwerindustrie, nukleare Fähigkeiten oder Demographie aber wichtiger sein.
Europa bleibt im militärisch und technologisch zurück. Zwar hört man immer wieder, Länder wie Deutschland wollten in die Chipherstellung einsteigen, doch eher vage und es ist schwierig, den Vorsprung aufzuholen. Das niederländische Unternehmen ASML ist für die Halbleiterindustrie jedoch zentral: Es hat ein Monopol auf Lithographiemaschinen, die für die Chipherstellung nötig sind. Auf Druck der USA verkauft ASML die besten Maschinen nicht nach China, wo nun Maschinen mit niedrigerer UV-Lichtfrequenz und viel schlechterer Auflösung eingesetzt werden. Ein Unternehmen ist nicht viel, dient der EU aber zumindest als Verhandlungsinstrument.
Anbruch des KI-Zeitalters
Es heißt, die nächsten 20 Jahre werden die Jahre der KI – wie die letzten 20 Jahre die des Internets waren. Prognosen sind schwierig, doch es ist wahrscheinlich, dass KI zum kritischen Faktor in Wirtschaft, Wissenschaft aber auch Gesellschaft wird. Obwohl KI-Konzerne bei den Fähigkeiten neuer Modelle auch schummeln, um ihre Software als möglichst relevant zu präsentieren, funktioniert Vieles früher Unvorstellbare schon jetzt sehr gut; ständig gibt es neue Entwicklungen. Kaum eine Branche, die nicht gerade KI in ihre Abläufe integriert.
Die Frage ist, ob KI bestehende Industrien und Dienstleistungen obsolet machen, oder einfach ein Werkzeug bleiben wird. Eine andere Frage ist die nach der Zeitleiste. Wie bald können wir mit weiteren fundamentalen Durchbrüchen rechnen? Der potentiellen Kapazität von KI sind grundsätzlich keine natürlichen Schranken gesetzt. Theoretisch ist auch menschliche Vernunft technologisch replizierbar. Das ist jedoch eine Sache auf Jahrzehnte.
Bestimmende Faktoren dafür, wie und wie schnell KI sich entwickeln wird, sind Energie und Halbleitertechnologie. Von beiden ist KI stark abhängig. Der hohe Stromverbrauch zum Trainieren von LLMs hat bei Software-Unternehmen sogar Interesse für Energiegewinnung geweckt. Microsoft etwa überlegt, ein Kernkraftwerk für den hauseigenen Bedarf zu bauen.
Gesellschaftlich stellt sich die Frage nach dem Arbeitsmarkt, doch die Geschichte zeigt, dass das nicht zwingend ein Problem sein muss. Auch in der Vergangenheit wurden Industriezweige manchmal obsolet, das führte dann zur Bildung neuer Industriezweige. Solange die Arbeiter:innenklasse dagegen ankämpft, muss auch der Wert der Arbeitskraft nicht zwingend sinken. Da die Arbeiter:innenbewegung in vielen Teilen der Welt aber gerade sehr geschwächt ist, ist es jedoch auch gut möglich, dass KI von den Herrschenden als Mittel gegen das Proletariat verwendet wird.
Teile diese Seite mit Freund:innen: