{"id":1178,"date":"2026-06-19T16:39:13","date_gmt":"2026-06-19T16:39:13","guid":{"rendered":"https:\/\/convly.ai\/huawei-ascend-950-pangu-explained-2026\/"},"modified":"2026-06-19T16:39:34","modified_gmt":"2026-06-19T16:39:34","slug":"huawei-ascend-950-pangu-explained-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/","title":{"rendered":"Huawei Ascend 950 &amp; Pangu: Chinas KI-Chip-Strategie f\u00fcr 2026"},"content":{"rendered":"<p>Huawei hat die vergangenen neun Monate damit verbracht, seine Pl\u00e4ne f\u00fcr KI-Silicon in einen konkreten Zeitplan umzusetzen. Auf der Huawei Connect im vergangenen September stellte das Unternehmen eine Roadmap mit vier Chips der Ascend-Reihe vor; auf der Huawei Cloud INSPIRE Creators Conference im Juni dieses Jahres legte es einen konkreten Termin f\u00fcr den wichtigsten Teil dieser Roadmap fest: Der Ascend 950DT \u2013 das Modell f\u00fcr Training und Decoding innerhalb der 950er-Familie \u2013 wird im August 2026 auf Huawei Cloud verf\u00fcgbar sein, mit einem vollst\u00e4ndigen kommerziellen Start im vierten Quartal 2026. Chen Lin, Vice President des Unternehmens, fasste den Zeitplan wie folgt zusammen: \u201eEine neue Generation pro Jahr, wobei sich die Rechenleistung jeweils verdoppelt.\u201c<\/p>\n<p>Das ist die zentrale Botschaft. Dieser Artikel untersucht, wie viel davon realistisch ist. Wir gehen die Chip-Roadmap und ihre tats\u00e4chlichen Spezifikationen durch, die auf Ascend trainierten openPangu-Modelle, die Open-Source-Initiative rund um CANN und die Mind-Toolchain zum Jahresende sowie die Einschr\u00e4nkungen, auf die niemand w\u00e4hrend der Keynote einging: eine 7-nm-Grenze bei SMIC, eine heimische HBM-Versorgung, die nicht mithalten kann, und eine Leistungsl\u00fccke pro Chip gegen\u00fcber NVIDIA, die die Roadmap stillschweigend einr\u00e4umt.<\/p>\n<div class=\"convly-tldr\">\n<h3>Wichtigste Erkenntnisse<\/h3>\n<ul>\n<li><strong>Ein Chip pro Jahr, jeweils mit etwa doppelter Leistung des Vorg\u00e4ngers.<\/strong> Ascend 950PR (Q1 2026), 950DT (Cloud im August 2026, kommerzieller Start Q4 2026), 960 (Q4 2027), 970 (Q4 2028), mit dem Ziel, bis 2028 ein systemweites Rechenleistungsziel von 4 FP4-Zettaflops zu erreichen.<\/li>\n<li><strong>Der 950 ist ein Chip, der mit Hopper gleichzieht \u2013 kein Konkurrent f\u00fcr Blackwell.<\/strong> Per chip it lands around 1 PFLOPS FP8 \/ 2 PFLOPS FP4 with 128\u2013144 GB of Huawei&#8217;s own HBM \u2014 strong, but a fraction of a single NVIDIA Rubin GPU.<\/li>\n<li><strong>Huaweis wahre Waffe ist Skalierung.<\/strong> Der Atlas 950 SuperPoD verbindet 8.192 Chips und behauptet, NVIDIA NVL144 hinsichtlich Gesamtrechenleistung, Speicher und Bandbreite durch reine Skalierung zu \u00fcbertreffen.<\/li>\n<li><strong>openPangu 2.0 wurde auf der HDC 2026 als Open-Source ver\u00f6ffentlicht.<\/strong> Ein Pro-Modell mit 505 Milliarden Parametern (18 Milliarden aktiv) und ein Flash-Modell mit 92 Milliarden Parametern (6 Milliarden aktiv), beide mit einem Kontextfenster von 512K; sieben Komponenten werden ab dem 30. Juni freigegeben.<\/li>\n<li><strong>Die ehrliche Einschr\u00e4nkung liegt in der Fertigung.<\/strong> SMIC ist bei 7 nm steckengeblieben, und die heimische HBM-Versorgung ist der Engpass; selbst im g\u00fcnstigsten Szenario eines Huawei-freundlichen Analysten erreicht sie 2026 lediglich etwa 5 % der gesamten KI-Rechenleistung von NVIDIA \u2013 und die mittlere Sch\u00e4tzung liegt deutlich darunter.<\/li>\n<li><strong>Selbst Huaweis eigene Roadmap zeigt f\u00fcr 2026 einen R\u00fcckschritt.<\/strong> Die 950PR\/950DT weisen eine geringere Gesamtverarbeitungsleistung auf als der Ascend 910C aus dem Jahr 2025; laut Huaweis eigenem Zeitplan ist erst der 960 im vierten Quartal 2027 in der Lage, eine H200 zu \u00fcbertreffen.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a38a95b685c6\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Umschalten<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a38a95b685c6\"  aria-label=\"Umschalten\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#The_roadmap_one_generation_a_year\" >Die Roadmap: Eine neue Generation pro Jahr<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#What_the_Ascend_950_actually_is\" >Was der Ascend 950 tats\u00e4chlich ist<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#Scale_as_the_strategy\" >Skalierung als Strategie<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#openPangu_the_model_side\" >openPangu: Die Modellseite<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#The_open-source_play\" >Die Open-Source-Initiative<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#The_constraints_Huawei_didnt_dwell_on\" >Die Einschr\u00e4nkungen, auf die Huawei nicht einging<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#FAQ\" >H\u00e4ufig gestellte Fragen (FAQ)<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#Bottom_line\" >Fazit<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/de\/huawei-ascend-950-pangu-explained-2026\/#Related_articles\" >Verwandte Artikel<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_roadmap_one_generation_a_year\"><\/span>Die Roadmap: Eine neue Generation pro Jahr<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Huaweis Darstellung folgt einem metronomartigen Rhythmus: vier Teile, jeweils ein Jahr auseinander, wobei jeder ungef\u00e4hr die Leistung des Vorg\u00e4ngers verdoppelt:<\/p>\n<ul>\n<li><strong>Ascend 950PR<\/strong> \u2014 Q1 2026, f\u00fcr Prefill und Empfehlungssysteme<\/li>\n<li><strong>Ascend 950DT<\/strong> \u2014 Cloud-Verf\u00fcgbarkeit im August 2026, kommerzieller Start im vierten Quartal 2026, f\u00fcr Decoding und Training<\/li>\n<li><strong>Ascend 960<\/strong> \u2014 Q4 2027<\/li>\n<li><strong>Ascend 970<\/strong> \u2014 Q4 2028<\/li>\n<\/ul>\n<p>Die Suffixe \u201ePR\u201c und \u201eDT\u201c sind der interessante Teil. Statt einen universell einsetzbaren Beschleuniger auf den Markt zu bringen, hat Huawei die Inferenz in zwei Teile aufgeteilt. Der 950PR ist speziell f\u00fcr die Prefill-Phase \u2013 den rechenintensiven Durchlauf \u00fcber Ihre Eingabe \u2013 sowie f\u00fcr Empfehlungssysteme optimiert. Der 950DT hingegen ist f\u00fcr Decoding (generierung von Token nach Token) und langfristiges Training ausgelegt, weshalb er \u00fcber mehr Speicher verf\u00fcgt. Falls Sie unseren Artikel \u201eNPU vs. GPU\u201c gelesen haben, ist diese Idee Ihnen bereits bekannt \u2013 hier wird sie jedoch noch konsequenter umgesetzt: Die Hardware wird speziell auf die jeweilige Phase der Workload zugeschnitten. <a href=\"\/de\/npu-vs-gpu-for-ai-2026\/\">NPU-vs.-GPU-Erkl\u00e4rung<\/a>\u2013 dies ist eine bekannte Idee, die hier weiter vorangetrieben wird: Spezialisierung der Hardware auf die jeweilige Phase der Workload.<\/p>\n<p>Die Schlagzeilenzahl \u2013 etwa 4 FP4-Zettaflops bis 2028 \u2013 ist ein systemweites Ziel f\u00fcr den Atlas 960 SuperCluster, nicht f\u00fcr einen einzelnen Chip. Behalten Sie diesen Unterschied stets im Hinterkopf, sobald Sie eine Angabe in Zettaflops im Zusammenhang mit Huawei sehen: Diese beeindruckenden Zahlen beschreiben stets ein Geb\u00e4ude voller Beschleuniger \u2013 niemals den einzelnen Beschleuniger.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"What_the_Ascend_950_actually_is\"><\/span>Was der Ascend 950 tats\u00e4chlich ist<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Hier sind die Spezifikationen pro Chip, die Huawei ver\u00f6ffentlicht hat. Es handelt sich um Herstellerangaben f\u00fcr Komponenten, die Mitte Juni 2026 erst teilweise ausgeliefert wurden; behandeln Sie diese daher als Zielvorgaben statt als getestete Benchmark-Ergebnisse.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Spezifikationen<\/th>\n<th>Ascend 950PR<\/th>\n<th>Ascend 950DT<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Verf\u00fcgbarkeit<\/td>\n<td>Q1 2026<\/td>\n<td>Cloud im August 2026, kommerzieller Start Q4 2026<\/td>\n<\/tr>\n<tr>\n<td>Rolle<\/td>\n<td>Prefill \/ Empfehlung<\/td>\n<td>Decodierung \/ Training<\/td>\n<\/tr>\n<tr>\n<td>FP8-Berechnung<\/td>\n<td>~1 PFLOPS<\/td>\n<td>~1 PFLOPS<\/td>\n<\/tr>\n<tr>\n<td>FP4-Berechnung<\/td>\n<td>~2 PFLOPS<\/td>\n<td>~2 PFLOPS<\/td>\n<\/tr>\n<tr>\n<td>Arbeitsspeicher<\/td>\n<td>128 GB HiBL 1.0<\/td>\n<td>144 GB HiZQ 2.0<\/td>\n<\/tr>\n<tr>\n<td>Speicherbandbreite<\/td>\n<td>~1,6 TB\/s<\/td>\n<td>~4,0 TB\/s<\/td>\n<\/tr>\n<tr>\n<td>Interconnect<\/td>\n<td>2 TB\/s<\/td>\n<td>2 TB\/s<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Das wirklich bemerkenswerte hier ist der Arbeitsspeicher. HiBL und HiZQ sind Huaweis eigene Hochbandbreitenspeicher \u2013 eine in China entwickelte HBM-Variante (High-Bandwidth Memory), die entstand, weil Exportbeschr\u00e4nkungen den einfachen Zugang zu den neuesten Speicherstapeln von SK Hynix, Micron und Samsung unterbanden. Dass ein chinesischer Anbieter \u00fcberhaupt wettbewerbsf\u00e4higen On-Package-HBM liefert, ist ein echtes technisches Meisterst\u00fcck; die 144 GB des 950DT mit einer Bandbreite von 4,0 TB\/s liegen im \u00fcblichen Leistungsbereich moderner Trainings-ASICs. Huawei gibt zudem an, dass der 2-TB\/s-Interconnect des 950DT etwa das 2,5-Fache dessen des Vorg\u00e4ngers 910C betr\u00e4gt \u2013 wiederum eine Angabe des Herstellers.<\/p>\n<p>Nun zur Realit\u00e4tspr\u00fcfung: NVIDIAs Rubin VR200, der ebenfalls f\u00fcr die zweite Jahresh\u00e4lfte 2026 angek\u00fcndigt ist, zielt auf rund 35 PFLOPS FP4 f\u00fcr das Training und etwa 50 PFLOPS FP4 f\u00fcr Inferenz ab, bei 288 GB HBM4 mit einer Bandbreite von rund 22 TB\/s. (Dies sind NVIDIAs eigene Klassifizierungen \u2013 Training versus Inferenz \u2013 und keine Unterscheidung zwischen dichten und sp\u00e4rlichen Berechnungen.) Auf Basis der reinen FP4-Leistung pro Chip ergibt sich damit eine L\u00fccke von etwa dem 17- bis 25-Fachen gegen\u00fcber einem einzelnen Ascend-950-Chip mit ~2 PFLOPS, je nachdem, welcher Rubin-Wert zugrunde gelegt wird. Huaweis eigene Atlas-350-Karte auf Basis des 950PR verspricht 1,56 PFLOPS FP4 und \u201e2,8-mal so viel wie der H20\u201c \u2013 doch selbst dieser Vergleich bezieht sich lediglich auf den abgespeckten, exportkonformen H20, nicht auf einen vollwertigen Blackwell- oder Rubin-Chip, und bleibt zudem eine Herstellerangabe ohne unabh\u00e4ngige Validierung. Die sachliche Kurzzusammenfassung, die auch von Analysten geteilt wird, lautet: Ein einzelner Ascend-950-Chip erreicht ann\u00e4hernd die Leistungsf\u00e4higkeit von NVIDIAs Hopper-Generation, nicht jedoch diejenige der Chips, die NVIDIA 2026 vermarktet. F\u00fcr Kontext zum NVIDIA-Seitenvergleich siehe unseren <a href=\"\/de\/nvidia-vera-rubin-explained-2026\/\">Vera-Rubin-\u00dcberblick<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Scale_as_the_strategy\"><\/span>Skalierung als Strategie<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Huawei wei\u00df, dass es den direkten Chip-gegen-Chip-Wettbewerb nicht gewinnen kann \u2013 und versucht es daher gar nicht erst. Stattdessen setzt es auf Systemarchitektur. Der Atlas-950-SuperPoD verbindet 8.192 Ascend-950DT-Beschleuniger zu einer logischen Maschine: rund 8 EFLOPS FP8 und 16 EFLOPS FP4, 1.152 TB Arbeitsspeicher sowie etwa 16 PB\/s Interconnect-Bandbreite \u00fcber ein optisches Fabric. Stapelt man 64 solcher SuperPoDs zu einem Atlas-950-SuperCluster, erh\u00e4lt man mehr als 520.000 NPUs mit insgesamt etwa 524 EFLOPS FP8 und knapp 1 Zettaflops FP4. Der f\u00fcr 2027 angek\u00fcndigte Atlas-960-SuperCluster strebt die Million-Karten-Marke an und die Leistungsangaben von 2 bzw. 4 Zettaflops (FP8\/FP4).<\/p>\n<p>Im Vergleich zum NVL144 von NVIDIA behauptet Huawei, der 950-SuperPoD biete etwa eine Gr\u00f6\u00dfenordnung mehr Beschleuniger und rund das 6,7-Fache der Gesamtrechenleistung \u2013 zudem deutlich mehr Speicher (ca. das 15-Fache) und Interconnect-Bandbreite. Das kann zwar gleichzeitig wahr und irref\u00fchrend sein: Hier wird ein 8.192-Chip-Pod mit einem 144-GPU-Rack verglichen. Die ehrliche Interpretation lautet: Hat man unbegrenzten Platz, g\u00fcnstigen Strom und gen\u00fcgend Chips zur Verf\u00fcgung, l\u00e4sst sich ein kleineres, effizienteres NVIDIA-System durch blo\u00dfe Rechenkraft \u00fcbertrumpfen. Das sind drei gro\u00dfe Unbekannte \u2013 und die dritte davon, n\u00e4mlich \u201egen\u00fcgend Chips\u201c, ist genau der Punkt, an dem die Sache schwierig wird.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"openPangu_the_model_side\"><\/span>openPangu: Die Modellseite<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Eine Chipplattform ist nur so n\u00fctzlich wie die Software, die darauf l\u00e4uft \u2013 und Huawei hat auch hier kr\u00e4ftig nachgelegt. Auf seiner Entwicklerkonferenz (HDC) im Juni 2026 stellte Huawei <strong>openPangu 2.0<\/strong>: ein Pro-Modell mit insgesamt 505 Mrd. Parametern und 18 Mrd. aktiven Parametern sowie ein Flash-Modell mit 92 Mrd. bzw. 6 Mrd. Parametern vor, beide mit Unterst\u00fctzung f\u00fcr einen Kontext von 512 K Token. Huawei behauptet, das Pro-Modell verdopple die Durchsatzleistung pro Karte im Vergleich zu anderen f\u00fchrenden Open-Source-Modellen auf Ascend-Hardware \u2013 erneut eine Herstellerangabe auf eigener Hardware, nicht ein unabh\u00e4ngig validiertes Benchmark-Ergebnis.<\/p>\n<p>Dies baut auf dem Pangu-Pro-MoE-72B aus dem Jahr 2025 auf, der eine Mixture-of-Grouped-Experts-(MoGE)-Architektur einf\u00fchrte, die speziell darauf ausgelegt ist, die Last gleichm\u00e4\u00dfig \u00fcber Ascend-Chips zu verteilen. Das Muster ist bewusst gew\u00e4hlt: Modellarchitektur und Hardware werden gemeinsam entworfen, sodass Schw\u00e4chen des Beschleunigers weniger ins Gewicht fallen. Dies stellt eine andere Philosophie dar als der \u201edicht-dann-sparse\u201c-Ansatz hinter Modellen wie <a href=\"\/de\/deepseek-explained-2026\/\">DeepSeek<\/a>, verfolgt aber dasselbe Ziel \u2013 m\u00f6glichst fortschrittliches Verhalten aus rechenbeschr\u00e4nkter Hardware herauszuholen.<\/p>\n<div class=\"convly-procons\">\n<div class=\"pros\">\n<h4>Was funktioniert<\/h4>\n<ul>\n<li>Eigene HBM-Massenspeicherproduktion \u2013 ein echter Meilenstein in der Lieferkette<\/li>\n<li>Ein glaubw\u00fcrdiger, zeitlich konkretisierter Fahrplan statt blo\u00dfer Zukunftsmusik<\/li>\n<li>Open-Source-Freigabe von CANN, Mind und Pangu, um Entwickler von CUDA wegzulocken<\/li>\n<li>Systemskalierte Designs, die die Leistungsl\u00fccke pro Chip umgehen<\/li>\n<\/ul>\n<\/div>\n<div class=\"cons\">\n<h4>Was es behindert<\/h4>\n<ul>\n<li>SMIC auf 7 nm begrenzt; gro\u00dfe Dies weisen bei diesem Knoten schlechte Ausbeute auf<\/li>\n<li>Die HBM-Versorgung ist die eigentliche Obergrenze f\u00fcr ausgelieferte Chips<\/li>\n<li>Die Leistung pro Chip liegt bei TPP (Total Processing Performance) um rund das F\u00fcnffache unter der von NVIDIA<\/li>\n<li>Die Teile aus 2026 zeigen im Vergleich zum eigenen 910C aus 2025 sogar einen R\u00fcckgang bei TPP<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_open-source_play\"><\/span>Die Open-Source-Initiative<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Der Softwarevorsto\u00df ist der Teil, der langfristig am wahrscheinlichsten entscheidend sein wird. Auf der Huawei-Connect-Konferenz verpflichtete sich das Unternehmen, seinen gesamten Softwarestack bis zum 31. Dezember 2025 freizugeben: die <strong>CANN<\/strong> -Toolbox f\u00fcr heterogene Berechnungen (Huaweis Antwort auf CUDA), die <strong>Mind<\/strong> -Toolchains und Entwicklungsumgebung sowie die <strong>openPangu<\/strong> -Grundlagenmodelle. Eric Xu stellte dies als Langzeitprojekt dar und k\u00fcndigte an, j\u00e4hrlich rund 15 Milliarden Yuan (ca. 2,1 Mrd. US-Dollar) \u00fcber f\u00fcnf Jahre hinweg in \u00d6kosystem und offenes Computing zu investieren.<\/p>\n<p>Die Logik ist schl\u00fcssig. NVIDIAs wirkliche Schutzmauer ist nicht die Siliziumtechnologie, sondern CUDA und die \u00fcber ein Jahrzehnt gewachsenen Bibliotheken darauf. Wenn Huawei Ascend zu mehr als nur einer geschlossenen Plattform f\u00fcr chinesische Hyperscaler machen will, muss es den Portieraufwand minimieren und Entwicklern Zugriff auf den Quellcode gew\u00e4hren. Ob dies gelingt, ist eine empirische Frage, die man in den kommenden Monaten anhand von GitHub-Signalen beantworten kann \u2013 etwa aktiven Pull Requests, regelm\u00e4\u00dfigen Releases und Community-gewarteten Kernels. Die Compiler-Schnittstellen und der virtuelle Befehlssatz von CANN sollen ge\u00f6ffnet werden (zusammen mit der vollst\u00e4ndigen Open-Source-Freigabe von CANN); der Beweis wird die Adoption durch Drittanbieter au\u00dferhalb Huaweis eigener Kunden sein.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_constraints_Huawei_didnt_dwell_on\"><\/span>Die Einschr\u00e4nkungen, auf die Huawei nicht einging<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Hier liegt der unbequeme Kern: Jede beeindruckende Zahl oben st\u00f6\u00dft auf dieselbe Barriere \u2013 Huawei kann nicht gen\u00fcgend dieser Chips auf einem wettbewerbsf\u00e4higen Fertigungsknoten produzieren.<\/p>\n<p>SMIC ist auf einen 7-nm-Klasse-Prozess festgelegt, da Exportbeschr\u00e4nkungen die EUV-Lithographie aus China ausschlie\u00dfen, und die Ausbeute bei gro\u00dfen KI-Dies auf diesem Knoten ist gering. Noch schlimmer ist jedoch <strong>die HBM-Bottleneck-Situation<\/strong> \u2013 sie ist noch restriktiver als die Fertigung der Dies selbst. Nach Sch\u00e4tzungen von SemiAnalysis kann der chinesische Speicherhersteller CXMT im n\u00e4chsten Jahr nur rund zwei Millionen HBM-Stapel produzieren, was f\u00fcr etwa 250.000 bis 300.000 Ascend-\u00e4hnliche Chips ausreicht \u2013 obwohl SMIC theoretisch Dies f\u00fcr weit \u00fcber eine Million Chips fertigen k\u00f6nnte. Ohne HBM-Stapel k\u00f6nnen keine fertigen Beschleuniger ausgeliefert werden, egal wie viele Rechendies SMIC herstellt.<\/p>\n<p>Die Leistungsrechnung folgt daraus zwangsl\u00e4ufig. Analysten des Council on Foreign Relations sch\u00e4tzen, dass die besten US-amerikanischen KI-Chips derzeit etwa f\u00fcnfmal leistungsf\u00e4higer sind als Huaweis beste Chips bezogen auf die Gesamtverarbeitungsleistung (TPP); bis zur zweiten Jahresh\u00e4lfte 2027 soll sich dieser Abstand auf rund das Siebzehnfache vergr\u00f6\u00dfern. Bei der aggregierten Rechenleistung sieht das CFR-Szenario, das Huawei am g\u00fcnstigsten bewertet, f\u00fcr 2026 immerhin noch eine Produktion von rund 5 % der gesamten NVIDIA-KI-Rechenleistung vor \u2013 f\u00fcr 2027 sinkt dieser Wert auf etwa 2 %; die mittlere Sch\u00e4tzung liegt deutlich niedriger, bei rund 1 %. Am aufschlussreichsten: Die Ascend-950PR- und 950DT-Modelle aus 2026 weisen tats\u00e4chlich <em>geringere<\/em> TPP-Werte als der Ascend-910C aus 2025 \u2013 ein Indiz daf\u00fcr, wie schwer die heimische Fertigung ist. Und laut Huaweis eigenem Fahrplan ist der erste Chip, der den H200 hinsichtlich Leistung oder Speicherbandbreite \u00fcbertrifft, der Ascend-960, der erst im vierten Quartal 2027 erscheinen soll. Falls Sie heute Hardware f\u00fcr lokales Modelltraining w\u00e4hlen m\u00fcssen, ist unser <a href=\"\/de\/best-gpus-for-local-llms-2026\/\">Leitfaden zu den besten GPUs f\u00fcr lokale LLMs<\/a> ein praktikablerer Ausgangspunkt als irgendetwas aus diesem Fahrplan.<\/p>\n<p>All dies bedeutet keineswegs, dass die Bem\u00fchungen blo\u00dfe Show sind. NVIDIAs Jensen Huang bezeichnete Huawei wiederholt als \u201ebeeindruckend\u201c \u2013 im Mai 2026 sagte er sogar, NVIDIA habe den fortgeschrittenen chinesischen KI-Chipmarkt \u201eweitgehend Huawei \u00fcberlassen\u201c. Der Wettbewerb ist real; die Fertigungsmathematik zeigt jedoch, dass vor allem der Zeitplan entscheidend ist \u2013 und Zeitpl\u00e4ne auf limitierten Fertigungsknoten verschieben sich regelm\u00e4\u00dfig.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>H\u00e4ufig gestellte Fragen (FAQ)<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>Ist der Huawei-Ascend-950 besser als NVIDIAs Blackwell oder Rubin?<\/h3>\n<p>Nein, nicht pro Chip. Ein einzelner Ascend-950 erreicht etwa Hopper-Klasse-Leistung \u2013 rund 1 PFLOPS FP8 und 2 PFLOPS FP4 \u2013 w\u00e4hrend NVIDIAs Rubin VR200 f\u00fcr das Training etwa 35 PFLOPS FP4 und f\u00fcr Inferenz 50 PFLOPS FP4 anstrebt. Huaweis Argument richtet sich auf Systemebene: Verbindet man Tausende Chips miteinander, l\u00e4sst sich ein kleineres NVIDIA-Rack bei der Gesamtleistung schlagen.<\/p>\n<h3>Wann wird der Ascend-950DT tats\u00e4chlich ausgeliefert?<\/h3>\n<p>Er wird ab August 2026 \u00fcber Huawei Cloud als cloudbasierter Dienst verf\u00fcgbar sein; der vollst\u00e4ndige kommerzielle Start (Karten und SuperPoD-Server) ist f\u00fcr das vierte Quartal 2026 geplant. Der 950PR begann bereits fr\u00fcher, im ersten Quartal 2026, ausgeliefert zu werden.<\/p>\n<h3>Was ist openPangu und wie unterscheidet es sich vom Pangu-Pro-MoE-72B?<\/h3>\n<p>openPangu 2.0, auf der HDC 2026 vorgestellt, ist die j\u00fcngste Open-Source-Modellfamilie: ein Pro-Modell mit 505 Mrd. Parametern (18 Mrd. aktiv) und ein Flash-Modell mit 92 Mrd. (6 Mrd. aktiv), beide mit 512K-Token-Kontext. Der Pangu-Pro-MoE-72B aus dem Jahr 2025 war das fr\u00fchere Modell, das die f\u00fcr Ascend optimierte Mixture-of-Grouped-Experts-Architektur einf\u00fchrte.<\/p>\n<h3>Kann Huawei gen\u00fcgend Ascend-Chips produzieren, um relevant zu sein?<\/h3>\n<p>Genau das ist die eigentliche Grenze. Nach Sch\u00e4tzungen von SemiAnalysis begrenzt das HBM-Angebot die j\u00e4hrliche Produktionskapazit\u00e4t auf rund 250.000 bis 300.000 Ascend-\u00e4hnliche Chips, und SMICs Ausbeute bei 7 nm ist schwach. Selbst das g\u00fcnstigste CFR-Szenario sieht f\u00fcr 2026 nur etwa 5 % der gesamten NVIDIA-KI-Rechenleistung vor, w\u00e4hrend die mittlere Sch\u00e4tzung bei rund 1 % liegt.<\/p>\n<h3>Was sind HiBL- und HiZQ-Speicher?<\/h3>\n<p>Sie sind Huaweis eigene Hochbandbreitenspeicher, die entwickelt wurden, weil Exportbeschr\u00e4nkungen den Zugang zu den neuesten HBM-Modulen von Drittanbietern einschr\u00e4nken. Der 950PR nutzt 128 GB HiBL 1.0 (~1,6 TB\/s); der 950DT verwendet 144 GB HiZQ 2.0 (~4,0 TB\/s).<\/p>\n<h3>Warum open-source-t Huawei CANN und die Pangu-Modelle?<\/h3>\n<p>Um NVIDIAs Software-Abh\u00e4ngigkeit zu brechen. CUDA ist NVIDIAs eigentliche Schutzmauer, daher \u00f6ffnet Huawei CANN (seine CUDA-Alternative), die Mind-Toolchain und die Pangu-Modelle, um den Portieraufwand zu senken und ein Entwickler-\u00d6kosystem rund um Ascend aufzubauen.<\/p>\n<h3>Was bedeutet die Aussage \u201e4 Zettaflops bis 2028\u201c eigentlich?<\/h3>\n<p>Es handelt sich um ein systemweites Ziel f\u00fcr den Atlas-960-SuperCluster \u2013 einen Cluster mit einer Million Beschleunigerkarten \u2013 bei FP4-Pr\u00e4zision, nicht um eine einzelne Chip-Leistung. Einzelne Ascend-Beschleuniger werden in Petaflops gemessen, also drei Gr\u00f6\u00dfenordnungen niedriger.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Fazit<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Huaweis Ank\u00fcndigungen f\u00fcr 2026 sind gleicherma\u00dfen ernst zu nehmen und zugleich durch klare Grenzen eingeschr\u00e4nkt. Die Roadmap ist real, der eigenentwickelte HBM-Speicher stellt einen echten Meilenstein dar, die offenen Pangu-Modelle sowie die Open-Source-Ver\u00f6ffentlichung von CANN sind kluge Schritte, um NVIDIAs Software-Moat St\u00fcck f\u00fcr St\u00fcck zu untergraben, und die Skalierung des SuperPoD ist eine raffinierte Strategie, um Schw\u00e4chen der Halbleiterhardware zu umgehen. All dies sollte man zun\u00e4chst unvoreingenommen zur Kenntnis nehmen.<\/p>\n<p>Dann liest man jedoch die Kleingedruckten. Pro Chip stellt der Ascend-950 eine Komponente der Hopper-\u00c4ra dar, die allerdings in einem Jahr der Rubin-\u00c4ra erscheint; selbst Huaweis eigene Roadmap zeigt zudem, dass die Chips f\u00fcr 2026 im Vergleich zum Ascend-910C aus dem Jahr 2025 insgesamt an Leistung verlieren. Die entscheidende Einschr\u00e4nkung liegt weder im mangelnden Ehrgeiz noch in fehlendem Design-Talent \u2013 vielmehr ist es die 7-nm-Fertigungsgrenze sowie ein HBM-Angebot, das j\u00e4hrlich nur einige hunderttausend Chips versorgen kann. F\u00fcr chinesische Kunden, die vom Bezug von NVIDIA-Produkten ausgeschlossen sind, stellt Ascend derzeit die beste verf\u00fcgbare Option dar \u2013 und diese wird kontinuierlich besser; sogar NVIDIAs CEO bezeichnet Huawei als \u201ebeeindruckend stark\u201c und r\u00e4umt ein, dass sein Unternehmen diesen Markt weitgehend aufgegeben hat. F\u00fcr alle, die den globalen Wettlauf verfolgen, lautet das ehrliche Fazit: Huawei ist endg\u00fcltig als ernstzunehmender Konkurrent angekommen \u2013 doch die Chips selbst, die Ausbeute (Yields) und der Zeitplan beg\u00fcnstigen nach wie vor NVIDIA; dies wird sich voraussichtlich bis mindestens 2027 nicht \u00e4ndern, es sei denn, die Fertigungssituation verbessert sich sp\u00fcrbar.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Verwandte Artikel<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/de\/npu-vs-gpu-for-ai-2026\/\">NPU vs. GPU f\u00fcr KI: Was ist der Unterschied? (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/de\/china-ai-strategy\/\">Chinas KI im Jahr 2026: Modelle, Labore und Open-Source-Strategie<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/de\/kimi-k2-7-code-explained-2026\/\">Kimi K2.7 Code erkl\u00e4rt: Moonshots offenes Codierungsmodell mit 1 Billion Parametern<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Huawei has turned its AI silicon plans into a dated, one-chip-a-year roadmap, opened the openPangu 2.0 models, and committed to open-sourcing CANN. We weigh all of it against the constraints the keynote skipped: a 7nm ceiling at SMIC, a homegrown HBM supply that can feed only a few hundred thousand chips, and a per-chip gap to NVIDIA that Huawei&#8217;s own roadmap admits.<\/p>","protected":false},"author":1,"featured_media":1183,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[245],"tags":[757,776,420,780,775,778,777,779],"class_list":["post-1178","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-chips","tag-ai-chips","tag-ascend-950","tag-china-ai","tag-hbm","tag-huawei","tag-nvidia","tag-pangu","tag-smic"],"_links":{"self":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1178","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/comments?post=1178"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1178\/revisions"}],"predecessor-version":[{"id":1186,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1178\/revisions\/1186"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/media\/1183"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/media?parent=1178"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/categories?post=1178"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/tags?post=1178"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}