DeepSeek: Chinas KI-Coup und was dahinter steckt

20. Februar 2025Lesezeit: 5 Min.
Bernhard Seyringer Illustration
Kommentar von Bernhard Seyringer

Bernhard Seyringer ist Politikanalyst. Seine thematischen Schwerpunkte fokussieren „Strategic Foresight“ und „Neue Technologien und Internationale Politik“. Seyringer ist zudem Experte für digitale Geopolitik.

Vor genau einem Monat begann der DeepSeek-Rausch in westlichen Medien, der zu deutlichen Kurseinbrüchen beim US-Chip Hersteller Nvidia führte. Natürlich war der Zeitpunkt kein Zufall. Das Regime in Peking wollte am Tag der Angelobung von US-Präsident Trump zeigen, dass die Exportsanktionen gegen China vollkommen nutzlos sind. Es handelte sich um eine staatlich-akkordierte Propagandaaktion. Die Veröffentlichung von R1 war weder ein Indikator zur Wirksamkeit von US-Sanktionen, noch sollte man die kolportierten Zahlen allzu ernst nehmen. Die interessante Frage aber ist: Warum hat das chinesische Regime den Export eines in China entwickelten Algorithmus gestattet? Geht es hier nur um den Propagandasieg?

Das chinesische Unternehmen DeepSeek hatte am 20. Januar 2025 auf der US Open Source Plattform Hugging Face das Large Language Modell R1 veröffentlicht. Genauso gut wie OpenAI‘s ChatGPT-4, aber mit nur 5,6 Mio. US-Dollar Trainingskosten auf nur 2.000 Nvidia A800 Chips wesentlich effizienter.  

Eines dieser im Westen so gerne erzählten Startup-Märchen? 

Der DeepSeek-Hype

DeepSeek sorgt seit Jänner für viel Aufsehen. Die Künstliche Intelligenz spielt technisch in einer Liga mit Chat-GPT oder Gemini, kann aber viel effizienter und kostengünstiger betrieben werden. Herkömmliche Modelle beanspruchen enorme Rechenleistungen und Hochleistungs-Chips, die vor allem von dem US-Unternehmen Nvidia geliefert werden. Wegen Sanktionen werden diese leistungsfähigsten Chips aber nicht nach China geliefert – ein guter Nährboden für die Entwicklung von Modellen, die mit einfacheren Chips auskommen. DeepSeek stürmte binnen kürzester Zeit die App-Download-Charts und schickte Aktien westlicher HighTech-Unternehmen auf Talfahrt.

Wer steckt hinter DeepSeek

DeepSeek versteht sich als Forschungsunternehmen, das nicht einfach OpenAI-Rivale sein will, sondern Chinas Weg in Richtung „Artificial General Intelligence (AGI)“ ebnen soll. Ein Forschungsbereich, der höchste-politische Priorität genießt, und daher strengster Kontrolle durch die Staatssicherheit unterliegt. Das Unternehmen wurde im Frühling 2023 in Peking, genauer in Zhongguancun, dem wichtigsten High Tech Cluster in der Hauptstadt und mit einem weiteren Standort in Hangzhou, gegründet. Der Gründer, Liang Wenfeng, ist Absolvent der Universität von Zhejiang, die im West Hangzhou Scientific Innovation Corridor angesiedelt ist und auf Grundlagenforschung im Bereich KI fokussiert ist. Das Institut hat Zugang zum ExaScale-Supercomputer in Wuxi an dem auch das damals weltweit-größte LLM, das BaGuaLu-Modell der Beijing Academy of ArtificialIntelligence (BAAI) trainiert wurde. 

Das Kapital zur Gründung stammt vom 2015 gegründeten Hedge Fond „High Flyer“, der bereits sechs Jahre nach seiner Gründung, die 100 Mrd. Renmibi Schallmauer durchbrochen hatte und zu den Top-4 der Quantinvestment-Fonds des Landes zählt. Der Gründer Lu Zhengzhe ist ebenfalls Absolvent der Universität von Zhejiang. Lu investierte bereits ab 2019 in die Entwicklung der LLM‘s „YinghuoEins“ und „Zwei“ und hatte, damals noch völlig legal, um die 10.000 Nvidia A100 Chips erworben. Damit gehört High Flyer zu den maximal fünf chinesischen Unternehmen, die mehr als 10.000 derartiger Chips besitzen. Nach Schätzungen dürften sich die Investitionen auf ungefähr 1,6 Mrd. US-Dollar belaufen haben, und die Unternehmensgruppe verfügt mittlerweile über um die 50.000 Nvidia-Chips. Ohne staatliche Koordinierung ist das völlig unmöglich. 

Auch die Kontakte zu Partei und Regierung sind intensiv: DeepSeek wurde als eines von 30 Unternehmen von der staatlichen Regulierungsbehörde ausgewählt, um den Entwurf für das Gesetz zur Nationalen Datensicherheit von 2023 zu formulieren und ein Schwesterunternehmen aus dem „High-Flyer“-Konglomerat, wurde 2020 und 2023 zum „Nationalen High-Tech Unternehmen“ gekürt. Liang ist außerdem nicht nur einmal an der Seite von Ministerpräsident Li Qiang aufgetreten und pflegt eine politisch-sensible persönliche Freundschaft zum Gründer des Drohnenherstellers DJI, Frank Wang. 

Wie zahnlos sind die US-Exportsanktionen?

DeepSeek ist mit Sicherheit kein Beleg für die Ineffizienz der US-Exportbeschränkungen. Wohl eher ein Beleg für die Nutzlosigkeit – denn umgesetzt wurden sie von der Biden-Administration wohl eher augenzwinkernd. Die Exportbeschränken auf High-End-Chips sind nämlich kein generelles Exportverbot. Es handelt sich um ein Genehmigungsverfahren, das auf individueller Ebene vom BIS (Bureau of Industry and Security) im Auftrag des US-Handelsministeriums geprüft wird. Im Zeitraum von 2018-2023 wurde durchschnittlich nur ein Drittel der Anfragen von gelisteten, chinesischen Unternehmen zurückgewiesen. Halbwegs ernstzunehmend, ist das System ohnedies erst seit der Verschärfung vom Oktober 2023. Bis dahin war es chinesischen Unternehmen möglich, Nvidia-A100-Chips zwar nicht mehr ungehindert zu erwerben, aber über amerikanische Cloud-Provider zu nutzen.  

Aber auch Nvidia hat sich Mühe gegeben, die Sanktionen zu unterlaufen: Im Jahr 2022 hat das BIS den Verkauf des KI-Chips H100 nach China untersagt. Nvidia hatte bereits den H800 entwickelt, der sich gerade noch im Rahmen der erlaubten Vorgaben bewegte. Im Oktober 2023 wurde der Export des H800 untersagt, wobei kurz darauf, der sanktionskonforme H20 angeboten wurde. 

Das heißt, es war für High Flyer unter diesen Umständen kein Problem, die passenden Chips zu erwerben. Dazu kommt noch die Möglichkeit, dass die Halbleiter einfach aus nicht-sanktionierten Drittstaaten importiert wurden. 

Meistgelesene Artikel