{"id":1178,"date":"2026-06-19T16:39:13","date_gmt":"2026-06-19T16:39:13","guid":{"rendered":"https:\/\/convly.ai\/huawei-ascend-950-pangu-explained-2026\/"},"modified":"2026-06-19T16:39:34","modified_gmt":"2026-06-19T16:39:34","slug":"huawei-ascend-950-pangu-explained-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/","title":{"rendered":"Huawei Ascend 950 e Pangu: la strategia cinese sui chip per l'IA nel 2026"},"content":{"rendered":"<p>Negli ultimi nove mesi Huawei ha trasformato i propri piani per i chip IA in un calendario preciso. A settembre scorso, durante Huawei Connect, ha pubblicato una roadmap che prevede quattro chip Ascend; a giugno di quest'anno, alla conferenza Huawei Cloud INSPIRE Creators, ha fissato una data concreta per la parte pi\u00f9 importante di tale roadmap. L'Ascend 950DT, membro della famiglia 950 dedicato all'addestramento e alla decodifica, sar\u00e0 disponibile su Huawei Cloud ad agosto 2026, con lancio commerciale completo nel quarto trimestre 2026. Il vicepresidente dell'azienda Chen Lin ha riassunto questa cadenza come \u00abuna generazione all'anno, con raddoppio della potenza di calcolo\u00bb.<\/p>\n<p>Questa \u00e8 la proposta. Questo articolo analizza quanto di essa sia effettivamente realizzabile. Esamineremo la roadmap dei chip e le loro specifiche effettive, i modelli openPangu addestrati su Ascend, l'impulso verso l'open source previsto per fine anno riguardo a CANN e allo stack di strumenti Mind, nonch\u00e9 i vincoli sui quali nessuno degli oratori alla keynote si \u00e8 soffermato: un tetto tecnologico a 7 nm presso SMIC, una fornitura interna di HBM incapace di tenere il passo e un divario prestazionale per singolo chip rispetto a NVIDIA che la roadmap ammette tacitamente.<\/p>\n<div class=\"convly-tldr\">\n<h3>Punti chiave<\/h3>\n<ul>\n<li><strong>Un chip all'anno, ciascuno circa il doppio del precedente.<\/strong> Ascend 950PR (primo trimestre 2026), 950DT (disponibile sul cloud ad agosto 2026, lancio commerciale nel quarto trimestre 2026), 960 (quarto trimestre 2027), 970 (quarto trimestre 2028), con obiettivo finale di raggiungere un sistema da 4 zettaflops in FP4 entro il 2028.<\/li>\n<li><strong>Il 950 \u00e8 un chip paragonabile a Hopper, non un concorrente diretto di Blackwell.<\/strong> Per chip it lands around 1 PFLOPS FP8 \/ 2 PFLOPS FP4 with 128\u2013144 GB of Huawei&#8217;s own HBM \u2014 strong, but a fraction of a single NVIDIA Rubin GPU.<\/li>\n<li><strong>L'arma reale di Huawei \u00e8 la scala.<\/strong> L'Atlas 950 SuperPoD collega insieme 8.192 chip e dichiara di superare, in termini di potenza di calcolo aggregata, memoria e larghezza di banda, l'NVL144 di NVIDIA grazie alla forza bruta.<\/li>\n<li><strong>openPangu 2.0 \u00e8 stato reso open source durante l'HDC 2026.<\/strong> Un modello Pro da 505 miliardi di parametri (18 miliardi attivi) e un modello Flash da 92 miliardi di parametri (6 miliardi attivi), entrambi con contesto da 512K token, con sette componenti resi disponibili a partire dal 30 giugno.<\/li>\n<li><strong>Il vincolo onesto \u00e8 quello produttivo.<\/strong> SMIC \u00e8 bloccata a 7 nm e l'HBM sviluppata internamente rappresenta il collo di bottiglia; anche nello scenario pi\u00f9 favorevole per Huawei, secondo gli analisti, la capacit\u00e0 complessiva di calcolo AI raggiunger\u00e0 nel 2026 solo circa il 5% di quella di NVIDIA, mentre la stima mediana \u00e8 molto pi\u00f9 bassa.<\/li>\n<li><strong>Persino la roadmap ufficiale di Huawei mostra un regresso nel 2026.<\/strong> L'Ascend 950PR\/950DT presenta prestazioni di elaborazione totali inferiori rispetto all'Ascend 910C del 2025; secondo i piani stessi di Huawei, il primo chip in grado di superare l'H200 sar\u00e0 il 960, previsto per il quarto trimestre 2027.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a38a95c86589\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Attiva\/Disattiva<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a38a95c86589\"  aria-label=\"Attiva\/Disattiva\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#The_roadmap_one_generation_a_year\" >La roadmap: una generazione all'anno<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#What_the_Ascend_950_actually_is\" >Che cos'\u00e8 realmente l'Ascend 950<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#Scale_as_the_strategy\" >La scala come strategia<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#openPangu_the_model_side\" >openPangu: il lato modelli<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#The_open-source_play\" >L'iniziativa open source<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#The_constraints_Huawei_didnt_dwell_on\" >I vincoli sui quali Huawei non si \u00e8 soffermata<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#FAQ\" >Domande frequenti<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#Bottom_line\" >Conclusione<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/it\/huawei-ascend-950-pangu-explained-2026\/#Related_articles\" >Articoli correlati<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_roadmap_one_generation_a_year\"><\/span>La roadmap: una generazione all'anno<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La narrazione di Huawei \u00e8 metronomica: quattro parti, una per anno, ciascuna approssimativamente il doppio della precedente:<\/p>\n<ul>\n<li><strong>Ascend 950PR<\/strong> \u2014 primo trimestre 2026, prefill e sistemi di raccomandazione<\/li>\n<li><strong>Ascend 950DT<\/strong> \u2014 disponibilit\u00e0 sul cloud ad agosto 2026, lancio commerciale nel quarto trimestre 2026, decodifica e addestramento<\/li>\n<li><strong>Ascend 960<\/strong> \u2014 quarto trimestre 2027<\/li>\n<li><strong>Ascend 970<\/strong> \u2014 quarto trimestre 2028<\/li>\n<\/ul>\n<p>I suffissi \u00abPR\u00bb e \u00abDT\u00bb sono la parte interessante. Invece di lanciare un acceleratore generico, Huawei ha suddiviso l'inferenza in due parti. Il 950PR \u00e8 ottimizzato per la fase di prefill \u2014 la fase computazionalmente intensiva di elaborazione del prompt \u2014 e per i sistemi di raccomandazione. Il 950DT gestisce invece la decodifica (generazione token per token) e l'addestramento continuativo, motivo per cui dispone di una memoria pi\u00f9 capiente. Se avete letto la nostra spiegazione su <a href=\"\/it\/npu-vs-gpu-for-ai-2026\/\">NPU vs GPU<\/a>, questo concetto vi sar\u00e0 familiare: si tratta di un'idea gi\u00e0 nota, portata a un livello superiore attraverso una specializzazione ancora maggiore del silicio in base alla fase del carico di lavoro.<\/p>\n<p>Il dato principale \u2014 circa 4 zettaflops in FP4 entro il 2028 \u2014 \u00e8 un obiettivo a livello di sistema per l'Atlas 960 SuperCluster, non per un singolo chip. Tenete sempre presente questa distinzione ogni volta che vedete citati valori in zettaflops relativi a Huawei: tali cifre impressionanti descrivono sempre un intero edificio pieno di acceleratori, non un singolo acceleratore.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"What_the_Ascend_950_actually_is\"><\/span>Che cos'\u00e8 realmente l'Ascend 950<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Ecco le specifiche per singolo chip divulgate da Huawei. Si tratta di dati forniti dal produttore per componenti che, a met\u00e0 giugno 2026, sono stati solo parzialmente immessi sul mercato; trattateli quindi come obiettivi piuttosto che risultati verificati da benchmark.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Specifiche<\/th>\n<th>Ascend 950PR<\/th>\n<th>Ascend 950DT<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Disponibilit\u00e0<\/td>\n<td>Primo trimestre 2026<\/td>\n<td>Cloud ad agosto 2026, lancio commerciale nel quarto trimestre 2026<\/td>\n<\/tr>\n<tr>\n<td>Ruolo<\/td>\n<td>Prefill \/ sistemi di raccomandazione<\/td>\n<td>Decodifica \/ addestramento<\/td>\n<\/tr>\n<tr>\n<td>Calcolo FP8<\/td>\n<td>~1 PFLOPS<\/td>\n<td>~1 PFLOPS<\/td>\n<\/tr>\n<tr>\n<td>Calcolo FP4<\/td>\n<td>~2 PFLOPS<\/td>\n<td>~2 PFLOPS<\/td>\n<\/tr>\n<tr>\n<td>Memoria<\/td>\n<td>128 GB HiBL 1.0<\/td>\n<td>144 GB HiZQ 2.0<\/td>\n<\/tr>\n<tr>\n<td>Larghezza di banda della memoria<\/td>\n<td>~1,6 TB\/s<\/td>\n<td>~4,0 TB\/s<\/td>\n<\/tr>\n<tr>\n<td>Interconnessione<\/td>\n<td>2 TB\/s<\/td>\n<td>2 TB\/s<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>L\u2019aspetto davvero notevole in questo caso \u00e8 la memoria. HiBL e HiZQ sono memorie ad alta larghezza di banda sviluppate internamente da Huawei \u2014 una HBM \u00abfatta in casa\u00bb, progettata perch\u00e9 le restrizioni all\u2019esportazione hanno impedito l\u2019accesso agevole agli ultimi stack prodotti da SK Hynix, Micron e Samsung. Il fatto che un fornitore cinese riesca a commercializzare una HBM competitiva integrata sul package rappresenta un vero risultato ingegneristico, e i 144 GB della 950DT con una larghezza di banda di 4,0 TB\/s rientrano pienamente nella fascia di prestazioni attesa per una moderna unit\u00e0 dedicata all\u2019addestramento. Huawei afferma inoltre che l\u2019interconnessione da 2 TB\/s della 950DT \u00e8 circa 2,5 volte pi\u00f9 veloce di quella del suo predecessore 910C \u2014 anche questa, tuttavia, \u00e8 una stima fornita dal produttore.<\/p>\n<p>Ora passiamo alla realt\u00e0. La NVIDIA Rubin VR200, anch\u2019essa prevista per il secondo semestre del 2026, punta a circa 35 PFLOPS di calcolo FP4 per l\u2019addestramento e a circa 50 PFLOPS di FP4 per l\u2019inferenza, con 288 GB di HBM4 e una larghezza di banda di circa 22 TB\/s. (Queste etichette \u2014 \u00abaddestramento\u00bb contro \u00abinferenza\u00bb \u2014 sono quelle utilizzate direttamente da NVIDIA, non indicano una distinzione tra modalit\u00e0 densa e sparsa.) In termini di potenza di calcolo FP4 per singolo chip, ci\u00f2 comporta un divario di circa 17\u00d7\u201325\u00d7 rispetto ai ~2 PFLOPS di un singolo Ascend 950, a seconda del valore di riferimento scelto per la Rubin. La scheda Atlas 350 di Huawei, basata sull\u2019Ascend 950PR, dichiara invece 1,56 PFLOPS di FP4 e \u00ab2,8\u00d7 l\u2019H20\u00bb \u2014 ma anche in questo caso si tratta di un confronto con l\u2019H20 ridotta, conforme alle restrizioni all\u2019esportazione, e non con una GPU Blackwell o Rubin completa; inoltre, si tratta ancora una volta di un\u2019affermazione del produttore, in attesa di verifiche indipendenti. Una sintesi equilibrata, ripresa anche dagli analisti specializzati nel settore dei semiconduttori, \u00e8 che un singolo Ascend 950 raggiunge approssimativamente le prestazioni della generazione Hopper di NVIDIA, non quelle delle soluzioni che NVIDIA commercializzer\u00e0 nel 2026. Per un contesto aggiuntivo sul fronte NVIDIA, consultare la nostra analisi della <a href=\"\/it\/nvidia-vera-rubin-explained-2026\/\">Rubin Vera<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Scale_as_the_strategy\"><\/span>La scala come strategia<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Huawei sa bene di non poter vincere una gara chip contro chip, e quindi non ci prova nemmeno. La sua scommessa \u00e8 sull\u2019architettura di sistema. Il SuperPoD Atlas 950 integra 8.192 acceleratori Ascend 950DT in un\u2019unica macchina logica: circa 8 EFLOPS di calcolo FP8 e 16 EFLOPS di FP4, 1.152 TB di memoria e una larghezza di banda complessiva di interconnessione di circa 16 PB\/s su una rete ottica. Accoppiando 64 di questi SuperPoD in un Atlas 950 SuperCluster si ottengono oltre 520.000 NPU che erogano circa 524 EFLOPS di FP8 e quasi 1 zettaflops di FP4. Il SuperCluster Atlas 960, previsto per il 2027, punta al milione di chip e ai livelli di 2\/4 zettaflops (rispettivamente FP8\/FP4).<\/p>\n<p>Confrontato con l\u2019NVL144 di NVIDIA, Huawei sostiene che il 950 SuperPoD integri circa un ordine di grandezza in pi\u00f9 di acceleratori e offra circa 6,7\u00d7 la potenza computazionale aggregata, con una quantit\u00e0 di memoria molto superiore (circa 15\u00d7) e una larghezza di banda di interconnessione maggiore. Questo pu\u00f2 essere contemporaneamente vero e fuorviante: si sta infatti paragonando un pod da 8.192 chip a un rack da 144 GPU. L\u2019interpretazione onesta \u00e8 che, se si dispone di spazio illimitato, energia a basso costo e di un numero sufficiente di chip, \u00e8 possibile sovraperformare un sistema NVIDIA pi\u00f9 compatto ed efficiente. Si tratta per\u00f2 di tre condizioni molto impegnative, e la terza \u2014 \u00abun numero sufficiente di chip\u00bb \u2014 \u00e8 esattamente il punto in cui la situazione diventa critica.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"openPangu_the_model_side\"><\/span>openPangu: il lato modelli<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Una piattaforma hardware \u00e8 tanto utile quanto lo \u00e8 il software che vi gira sopra, e Huawei ha lavorato intensamente anche su questo fronte. Alla sua conferenza per gli sviluppatori (HDC), tenutasi a giugno 2026, Huawei ha rilasciato <strong>openPangu 2.0<\/strong>: un modello Pro con 505 miliardi di parametri totali e 18 miliardi attivi, e un modello Flash con 92 miliardi di parametri totali e 6 miliardi attivi, entrambi supportanti un contesto di 512K token. Huawei afferma che il modello Pro raddoppia approssimativamente il throughput su singola scheda rispetto ad altri modelli open source di primo piano su hardware Ascend \u2014 anche qui, tuttavia, si tratta di un dato fornito dal produttore, relativo esclusivamente al proprio silicio e non ancora verificato da benchmark indipendenti.<\/p>\n<p>Questo sviluppo si basa sul Pangu Pro MoE 72B del 2025, che aveva introdotto una progettazione \u00abMixture of Grouped Experts\u00bb (MoGE) specificamente concepita per bilanciare il carico di lavoro tra i vari chip Ascend. Il pattern \u00e8 intenzionale: co-progettare l\u2019architettura del modello insieme all\u2019hardware, in modo da ridurre l\u2019impatto dei punti deboli dell\u2019acceleratore. Si tratta di una filosofia diversa dall\u2019approccio \u00abdenso-poi-sparsa\u00bb alla base di modelli come <a href=\"\/it\/deepseek-explained-2026\/\">DeepSeek<\/a>, ma condivide lo stesso obiettivo: ottenere prestazioni prossime allo stato dell\u2019arte pur operando con risorse computazionali limitate.<\/p>\n<div class=\"convly-procons\">\n<div class=\"pros\">\n<h4>Ci\u00f2 che funziona<\/h4>\n<ul>\n<li>HBM prodotta internamente in volumi significativi \u2014 un vero traguardo strategico per la catena di approvvigionamento<\/li>\n<li>Una roadmap credibile e datata, non semplice \u00abvaporware\u00bb<\/li>\n<li>L\u2019apertura al pubblico di CANN, Mind e Pangu per attrarre sviluppatori lontano da CUDA<\/li>\n<li>Progetti architetturali su scala di sistema che aggirano il divario prestazionale per chip<\/li>\n<\/ul>\n<\/div>\n<div class=\"cons\">\n<h4>Ci\u00f2 che ne rallenta l\u2019adozione<\/h4>\n<ul>\n<li>SMIC bloccata a 7 nm; rendimenti scadenti sui die di grandi dimensioni<\/li>\n<li>La disponibilit\u00e0 di HBM rappresenta il vero limite alla produzione di chip<\/li>\n<li>Le prestazioni per chip sono circa 5\u00d7 inferiori a quelle di NVIDIA in termini di TPP (Total Processing Performance)<\/li>\n<li>I componenti 2026 registrano un regresso rispetto al 910C del 2025 in termini di TPP<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_open-source_play\"><\/span>L'iniziativa open source<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>L\u2019impegno sul fronte software \u00e8 probabilmente quello destinato a fare la differenza sul lungo periodo. Durante Huawei Connect, l\u2019azienda ha annunciato l\u2019apertura completa del proprio stack entro il 31 dicembre 2025: il toolkit eterogeneo per il calcolo <strong>CANN<\/strong> (la risposta di Huawei a CUDA), l\u2019ambiente di sviluppo e le toolchain della serie <strong>Mind<\/strong> e i modelli fondativi <strong>openPangu<\/strong> . Eric Xu ha descritto l\u2019iniziativa come un progetto a lungo termine, con un impegno finanziario annuo di circa 15 miliardi di yuan (circa 2,1 miliardi di dollari USA) per cinque anni, destinato a costruire un ecosistema e un\u2019infrastruttura di calcolo aperto.<\/p>\n<p>La logica \u00e8 solida. Il vero vantaggio competitivo di NVIDIA non risiede nel silicio, bens\u00ec in CUDA e nelle decine di librerie costruite negli anni su di esso. Se Huawei vuole che Ascend diventi qualcosa di pi\u00f9 di una piattaforma chiusa riservata agli iper-scaler cinesi, deve rendere il processo di migrazione semplice e garantire agli sviluppatori l\u2019accesso al codice sorgente. Se tale obiettivo sar\u00e0 raggiunto \u00e8 una domanda empirica, cui si potr\u00e0 rispondere nei prossimi mesi osservando i segnali su GitHub \u2014 PR attive, rilasci regolari, kernel mantenuti dalla comunit\u00e0. Le interfacce del compilatore CANN e il suo set di istruzioni virtuali sono programmati per essere resi pubblici (insieme all\u2019intero CANN, completamente open source); la vera prova sar\u00e0 l\u2019adozione da parte di terzi al di fuori dei clienti diretti di Huawei.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_constraints_Huawei_didnt_dwell_on\"><\/span>I vincoli sui quali Huawei non si \u00e8 soffermata<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Ecco il nodo critico, scomodo. Ogni impressionante cifra riportata sopra si scontra con lo stesso ostacolo: Huawei non riesce a produrre un numero sufficiente di questi chip su un nodo tecnologico competitivo.<\/p>\n<p>SMIC \u00e8 bloccata su un processo di tipo 7 nm perch\u00e9 le restrizioni all\u2019esportazione impediscono l\u2019accesso alla litografia EUV in Cina, e i rendimenti sui grandi die AI a tale nodo sono scadenti. Ancora peggio, <strong>l\u2019HBM \u00e8 il collo di bottiglia<\/strong> \u2014 pi\u00f9 limitante della stessa produzione dei die. Secondo le stime di SemiAnalysis, il produttore cinese di memorie CXMT riuscir\u00e0 a produrre solo circa 2 milioni di stack HBM il prossimo anno, sufficienti per circa 250.000\u2013300.000 chip di classe Ascend, bench\u00e9 SMIC potrebbe produrre die per oltre un milione di unit\u00e0. Senza stack HBM, gli acceleratori finiti non possono essere spediti, indipendentemente dal numero di die prodotti da SMIC.<\/p>\n<p>La matematica delle prestazioni ne deriva direttamente. Gli analisti del Council on Foreign Relations stimano che, attualmente, i migliori chip AI statunitensi siano circa cinque volte pi\u00f9 potenti di quelli di Huawei in termini di TPP, con un divario destinato ad ampliarsi fino a circa diciassette volte entro il secondo semestre del 2027. In termini di output aggregato, nello scenario pi\u00f9 favorevole a Huawei elaborato dal CFR, quest\u2019ultima produrr\u00e0 nel 2026 solo circa il 5% del totale del calcolo AI di NVIDIA, scendendo al 2% nel 2027 \u2014 mentre la stima mediana \u00e8 ben pi\u00f9 bassa, intorno all\u20191%. Il dato pi\u00f9 significativo: sia l\u2019Ascend 950PR che il 950DT del 2026 presentano effettivamente un TPP <em>inferiore<\/em> rispetto all\u2019Ascend 910C del 2025 \u2014 un chiaro segnale della difficolt\u00e0 della produzione domestica \u2014 e, secondo la roadmap stessa di Huawei, il primo chip in grado di superare l\u2019H200 sia in termini di prestazioni che di larghezza di banda della memoria sar\u00e0 l\u2019Ascend 960, previsto per il quarto trimestre del 2027. Se state scegliendo oggi un\u2019hardware per eseguire modelli localmente, la nostra <a href=\"\/it\/best-gpus-for-local-llms-2026\/\">guida alle migliori GPU per LLM locali<\/a> \u00e8 un punto di partenza pi\u00f9 pratico rispetto a qualsiasi elemento di questa roadmap.<\/p>\n<p>Nulla di tutto ci\u00f2 significa che l\u2019intero sforzo sia una messinscena. Jensen Huang di NVIDIA ha definito Huawei \u00abformidabile\u00bb in pi\u00f9 occasioni \u2014 nel maggio 2026 ha addirittura affermato che NVIDIA ha \u00ablargamente ceduto\u00bb il mercato cinese dei chip AI avanzati proprio a Huawei. La competizione \u00e8 reale; ci\u00f2 che la matematica produttiva mostra \u00e8 che il fattore decisivo \u00e8 il cronoprogramma, e i cronoprogrammi sui nodi tecnologici vincolati tendono a slittare.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>Domande frequenti<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>L\u2019Ascend 950 di Huawei \u00e8 migliore dei chip Blackwell o Rubin di NVIDIA?<\/h3>\n<p>No, non a livello di singolo chip. Un singolo Ascend 950 offre prestazioni simili a quelle della generazione Hopper \u2014 circa 1 PFLOPS di FP8 e 2 PFLOPS di FP4 \u2014 mentre la Rubin VR200 di NVIDIA punta a circa 35 PFLOPS di FP4 per l\u2019addestramento e 50 PFLOPS per l\u2019inferenza. L\u2019argomentazione di Huawei \u00e8 invece di livello sistemico: collegando migliaia di chip, \u00e8 possibile battere un rack NVIDIA pi\u00f9 piccolo in termini di prestazioni aggregate.<\/p>\n<h3>Quando verr\u00e0 effettivamente immesso sul mercato l\u2019Ascend 950DT?<\/h3>\n<p>Sar\u00e0 disponibile su Huawei Cloud a partire da agosto 2026 come servizio accessibile in cloud, con il lancio commerciale completo (schede e server SuperPoD) previsto per il quarto trimestre 2026. L\u2019Ascend 950PR ha invece gi\u00e0 iniziato le spedizioni nel primo trimestre 2026.<\/p>\n<h3>Che cos\u2019\u00e8 openPangu e in che cosa differisce dal Pangu Pro MoE 72B?<\/h3>\n<p>openPangu 2.0, rilasciato all\u2019HDC 2026, \u00e8 la pi\u00f9 recente famiglia open source: un modello Pro da 505 miliardi di parametri (18 miliardi attivi) e un modello Flash da 92 miliardi di parametri (6 miliardi attivi), entrambi con contesto da 512K token. Il Pangu Pro MoE 72B del 2025 era invece il modello precedente, che aveva introdotto l\u2019architettura \u00abMixture of Grouped Experts\u00bb ottimizzata per i chip Ascend.<\/p>\n<h3>Huawei riesce a produrre un numero sufficiente di chip Ascend per avere un impatto reale?<\/h3>\n<p>Questo \u00e8 il vero limite. Secondo le stime di SemiAnalysis, la disponibilit\u00e0 di HBM limita la produzione annua a circa 250.000\u2013300.000 chip di classe Ascend, e i rendimenti di SMIC a 7 nm sono scadenti. Anche nello scenario pi\u00f9 favorevole elaborato dal CFR, Huawei riuscirebbe a fornire nel 2026 solo circa il 5% del totale del calcolo AI di NVIDIA, con una stima mediana pi\u00f9 vicina all\u20191%.<\/p>\n<h3>Che cosa sono le memorie HiBL e HiZQ?<\/h3>\n<p>Sono memorie ad alta larghezza di banda sviluppate internamente da Huawei, create perch\u00e9 le restrizioni all\u2019esportazione limitano l\u2019accesso agli ultimi stack HBM di terze parti. L\u2019Ascend 950PR utilizza 128 GB di HiBL 1.0 (~1,6 TB\/s); l\u2019Ascend 950DT utilizza 144 GB di HiZQ 2.0 (~4,0 TB\/s).<\/p>\n<h3>Perch\u00e9 Huawei sta aprendo al pubblico CANN e i modelli Pangu?<\/h3>\n<p>Per rompere il lock-in software di NVIDIA. CUDA \u00e8 il vero vantaggio competitivo di NVIDIA, quindi Huawei sta aprendo CANN (la sua controparte di CUDA), la toolchain Mind e i modelli Pangu per ridurre i costi di migrazione e costruire un ecosistema di sviluppatori intorno alla piattaforma Ascend.<\/p>\n<h3>A cosa si riferisce esattamente l\u2019obiettivo di \u00ab4 zettaflop entro il 2028\u00bb?<\/h3>\n<p>Si tratta di un obiettivo a livello di sistema per il supercluster Atlas 960 \u2014 un cluster da un milione di schede \u2014 in precisione FP4, non di un singolo chip. Gli acceleratori Ascend individuali sono misurati in petaflop, tre ordini di grandezza inferiori.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Conclusione<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Gli annunci di Huawei per il 2026 sono al tempo stesso seri e fortemente vincolati. La roadmap \u00e8 reale, la memoria HBM sviluppata internamente rappresenta un vero traguardo, i modelli openPangu e l\u2019apertura del codice sorgente di CANN sono mosse intelligenti per erodere gradualmente la barriera software di NVIDIA, mentre la scalabilit\u00e0 su larga scala del SuperPoD \u00e8 un approccio astuto per aggirare le limitazioni del silicio. Tutti questi elementi vanno presi per buoni.<\/p>\n<p>Poi bisogna leggere le clausole contrattuali. A livello di singolo chip, l\u2019Ascend 950 \u00e8 una soluzione della generazione Hopper lanciata in un anno della generazione Rubin, e persino la roadmap stessa di Huawei mostra un calo delle prestazioni complessive dei chip 2026 rispetto all\u2019Ascend 910C del 2025. Il vincolo principale non \u00e8 l\u2019ambizione n\u00e9 la competenza progettuale, bens\u00ec il limite tecnologico dei 7 nm e una disponibilit\u00e0 di HBM sufficiente a produrre solo poche centinaia di migliaia di chip all\u2019anno. Per gli acquirenti cinesi tagliati fuori da NVIDIA, Ascend \u00e8 attualmente l\u2019opzione migliore disponibile e sta progressivamente migliorando; lo stesso CEO di NVIDIA definisce Huawei \u00abformidabile\u00bb e ammette che la societ\u00e0 ha sostanzialmente rinunciato a quel mercato. Per chi osserva la corsa globale, il verdetto onesto \u00e8 che Huawei \u00e8 effettivamente arrivata come concorrente reale, ma i chip, i tassi di resa e il calendario continuano ancora a favorire NVIDIA \u2014 e lo faranno fino al 2027, a meno che non cambi radicalmente la situazione produttiva.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Articoli correlati<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/it\/npu-vs-gpu-for-ai-2026\/\">NPU vs GPU per l\u2019IA: qual \u00e8 la differenza? (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/it\/china-ai-strategy\/\">L'IA in Cina nel 2026: modelli, laboratori e strategia open source<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/it\/kimi-k2-7-code-explained-2026\/\">Kimi K2.7 Code spiegato: il modello aperto per la programmazione da 1 trilione di token di Moonshot<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Huawei has turned its AI silicon plans into a dated, one-chip-a-year roadmap, opened the openPangu 2.0 models, and committed to open-sourcing CANN. We weigh all of it against the constraints the keynote skipped: a 7nm ceiling at SMIC, a homegrown HBM supply that can feed only a few hundred thousand chips, and a per-chip gap to NVIDIA that Huawei&#8217;s own roadmap admits.<\/p>","protected":false},"author":1,"featured_media":1183,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[245],"tags":[757,776,420,780,775,778,777,779],"class_list":["post-1178","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-chips","tag-ai-chips","tag-ascend-950","tag-china-ai","tag-hbm","tag-huawei","tag-nvidia","tag-pangu","tag-smic"],"_links":{"self":[{"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/posts\/1178","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/comments?post=1178"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/posts\/1178\/revisions"}],"predecessor-version":[{"id":1186,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/posts\/1178\/revisions\/1186"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/media\/1183"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/media?parent=1178"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/categories?post=1178"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/it\/wp-json\/wp\/v2\/tags?post=1178"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}