{"id":1178,"date":"2026-06-19T16:39:13","date_gmt":"2026-06-19T16:39:13","guid":{"rendered":"https:\/\/convly.ai\/huawei-ascend-950-pangu-explained-2026\/"},"modified":"2026-06-19T16:39:34","modified_gmt":"2026-06-19T16:39:34","slug":"huawei-ascend-950-pangu-explained-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/","title":{"rendered":"Huawei Ascend 950 e Pangu: a aposta da China em chips de IA para 2026"},"content":{"rendered":"<p>A Huawei dedicou os \u00faltimos nove meses a transformar seus planos de sil\u00edcio para IA em um cronograma concreto. Na confer\u00eancia Huawei Connect, realizada em setembro passado, a empresa divulgou uma rota de desenvolvimento com quatro chips Ascend; na Confer\u00eancia Huawei Cloud INSPIRE Creators, realizada em junho deste ano, atribuiu datas pr\u00f3ximas ao componente mais importante desse plano. O Ascend 950DT, membro da fam\u00edlia 950 destinado ao treinamento e \u00e0 gera\u00e7\u00e3o de tokens (decode), estar\u00e1 dispon\u00edvel na Huawei Cloud em agosto de 2026, com lan\u00e7amento comercial completo no quarto trimestre de 2026. Chen Lin, vice-presidente da empresa, resumiu esse ritmo como \u00abuma nova gera\u00e7\u00e3o por ano, dobrando a pot\u00eancia computacional\u00bb.<\/p>\n<p>Essa \u00e9 a proposta. Este artigo analisa at\u00e9 que ponto ela \u00e9 realista. Analisaremos detalhadamente a rota de desenvolvimento dos chips e suas especifica\u00e7\u00f5es reais, os modelos openPangu treinados nos chips Ascend, o impulso de c\u00f3digo aberto previsto para o fim do ano em torno da plataforma CANN e da ferramenta Mind, al\u00e9m das restri\u00e7\u00f5es que ningu\u00e9m mencionou na apresenta\u00e7\u00e3o principal: um limite tecnol\u00f3gico de 7 nm na SMIC, uma oferta dom\u00e9stica de HBM incapaz de acompanhar a demanda e uma lacuna por chip em rela\u00e7\u00e3o \u00e0s solu\u00e7\u00f5es da NVIDIA, que o pr\u00f3prio cronograma reconhece discretamente.<\/p>\n<div class=\"convly-tldr\">\n<h3>Principais conclus\u00f5es<\/h3>\n<ul>\n<li><strong>Um chip por ano, cada um com desempenho aproximadamente duas vezes maior que o anterior.<\/strong> Ascend 950PR (primeiro trimestre de 2026), Ascend 950DT (dispon\u00edvel na nuvem em agosto de 2026, lan\u00e7amento comercial no quarto trimestre de 2026), Ascend 960 (quarto trimestre de 2027), Ascend 970 (quarto trimestre de 2028), com objetivo final de atingir um sistema capaz de 4 zettaflops em FP4 at\u00e9 2028.<\/li>\n<li><strong>O Ascend 950 \u00e9 um chip projetado para equival\u00eancia com a arquitetura Hopper, n\u00e3o um substituto direto da Blackwell.<\/strong> Per chip it lands around 1 PFLOPS FP8 \/ 2 PFLOPS FP4 with 128\u2013144 GB of Huawei&#8217;s own HBM \u2014 strong, but a fraction of a single NVIDIA Rubin GPU.<\/li>\n<li><strong>A verdadeira arma da Huawei \u00e9 a escala.<\/strong> O Atlas 950 SuperPoD interconecta 8.192 chips e afirma superar, em termos agregados de poder computacional, mem\u00f3ria e largura de banda, a solu\u00e7\u00e3o NVL144 da NVIDIA, gra\u00e7as puramente \u00e0 for\u00e7a bruta da escala.<\/li>\n<li><strong>O openPangu 2.0 foi disponibilizado como c\u00f3digo aberto na HDC 2026.<\/strong> Um modelo Pro com 505 bilh\u00f5es de par\u00e2metros (18 bilh\u00f5es ativos) e um modelo Flash com 92 bilh\u00f5es de par\u00e2metros (6 bilh\u00f5es ativos), ambos com contexto de 512K tokens, tendo sete componentes liberados a partir de 30 de junho.<\/li>\n<li><strong>A restri\u00e7\u00e3o mais honesta \u00e9 a fabrica\u00e7\u00e3o.<\/strong> A SMIC permanece presa ao processo de 7 nm e a HBM desenvolvida internamente \u00e9 o gargalo cr\u00edtico; mesmo no cen\u00e1rio mais otimista entre os analistas favor\u00e1veis \u00e0 Huawei, sua capacidade agregada de computa\u00e7\u00e3o para IA em 2026 alcan\u00e7ar\u00e1 apenas cerca de 5% da oferecida pela NVIDIA, enquanto a estimativa mediana \u00e9 ainda menor.<\/li>\n<li><strong>At\u00e9 mesmo o pr\u00f3prio cronograma da Huawei revela uma regress\u00e3o em 2026.<\/strong> O Ascend 950PR\/950DT possui desempenho total de processamento inferior ao do Ascend 910C de 2025; segundo o pr\u00f3prio plano da Huawei, o primeiro chip capaz de superar o H200 ser\u00e1 o Ascend 960, previsto para o quarto trimestre de 2027.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a38a9892b610\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Alternar<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a38a9892b610\"  aria-label=\"Alternar\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#The_roadmap_one_generation_a_year\" >O cronograma: uma nova gera\u00e7\u00e3o por ano<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#What_the_Ascend_950_actually_is\" >O que realmente \u00e9 o Ascend 950<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#Scale_as_the_strategy\" >Escala como estrat\u00e9gia<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#openPangu_the_model_side\" >openPangu: o lado dos modelos<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#The_open-source_play\" >A iniciativa de c\u00f3digo aberto<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#The_constraints_Huawei_didnt_dwell_on\" >As restri\u00e7\u00f5es que a Huawei n\u00e3o destacou<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#FAQ\" >Perguntas frequentes<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#Bottom_line\" >Conclus\u00e3o<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/pt\/huawei-ascend-950-pangu-explained-2026\/#Related_articles\" >Artigos relacionados<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_roadmap_one_generation_a_year\"><\/span>O cronograma: uma nova gera\u00e7\u00e3o por ano<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>A narrativa da Huawei segue um ritmo metr\u00f4nomico: quatro partes, uma por ano, cada uma aproximadamente duas vezes mais potente que a anterior:<\/p>\n<ul>\n<li><strong>Ascend 950PR<\/strong> \u2014 primeiro trimestre de 2026, voltado para preenchimento inicial (prefill) e sistemas de recomenda\u00e7\u00e3o<\/li>\n<li><strong>Ascend 950DT<\/strong> \u2014 dispon\u00edvel na nuvem em agosto de 2026, lan\u00e7amento comercial no quarto trimestre de 2026, voltado para gera\u00e7\u00e3o de tokens (decode) e treinamento cont\u00ednuo<\/li>\n<li><strong>Ascend 960<\/strong> \u2014 quarto trimestre de 2027<\/li>\n<li><strong>Ascend 970<\/strong> \u2014 quarto trimestre de 2028<\/li>\n<\/ul>\n<p>Os sufixos \u00abPR\u00bb e \u00abDT\u00bb s\u00e3o a parte mais interessante. Em vez de lan\u00e7ar um acelerador de prop\u00f3sito geral, a Huawei dividiu a infer\u00eancia em duas especializa\u00e7\u00f5es distintas. O 950PR \u00e9 otimizado para a fase de preenchimento inicial (prefill) \u2014 a etapa computacionalmente intensiva de processamento do prompt \u2014 e para sistemas de recomenda\u00e7\u00e3o. J\u00e1 o 950DT lida com a gera\u00e7\u00e3o de tokens (decode) e com o treinamento sustentado, raz\u00e3o pela qual disp\u00f5e de mem\u00f3ria mais capaz. Se voc\u00ea leu nossa explica\u00e7\u00e3o sobre <a href=\"\/pt\/npu-vs-gpu-for-ai-2026\/\">NPU versus GPU<\/a>isso representa uma ideia familiar levada ainda mais longe: especializar o sil\u00edcio conforme a fase espec\u00edfica da carga de trabalho.<\/p>\n<p>O n\u00famero divulgado \u2014 aproximadamente 4 zettaflops em FP4 at\u00e9 2028 \u2014 \u00e9 uma meta definida para o n\u00edvel de sistema do Atlas 960 SuperCluster, n\u00e3o para um \u00fanico chip. Mantenha essa distin\u00e7\u00e3o sempre em mente sempre que vir um valor expresso em zettaflops associado \u00e0 Huawei; esses n\u00fameros impressionantes descrevem sempre um pr\u00e9dio inteiro cheio de aceleradores, nunca o acelerador isoladamente.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"What_the_Ascend_950_actually_is\"><\/span>O que realmente \u00e9 o Ascend 950<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Abaixo est\u00e3o as especifica\u00e7\u00f5es por chip divulgadas pela Huawei. Trata-se de dados fornecidos pelo fabricante para produtos que, at\u00e9 meados de junho de 2026, estavam apenas parcialmente dispon\u00edveis no mercado; portanto, devem ser considerados metas, e n\u00e3o resultados validados por benchmarks.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Especifica\u00e7\u00f5es<\/th>\n<th>Ascend 950PR<\/th>\n<th>Ascend 950DT<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Disponibilidade<\/td>\n<td>Primeiro trimestre de 2026<\/td>\n<td>Nuvem em agosto de 2026, lan\u00e7amento comercial no quarto trimestre de 2026<\/td>\n<\/tr>\n<tr>\n<td>Fun\u00e7\u00e3o<\/td>\n<td>Preenchimento inicial (prefill) \/ sistemas de recomenda\u00e7\u00e3o<\/td>\n<td>Decodifica\u00e7\u00e3o \/ treinamento<\/td>\n<\/tr>\n<tr>\n<td>C\u00e1lculo em FP8<\/td>\n<td>~1 PFLOPS<\/td>\n<td>~1 PFLOPS<\/td>\n<\/tr>\n<tr>\n<td>C\u00e1lculo em FP4<\/td>\n<td>~2 PFLOPS<\/td>\n<td>~2 PFLOPS<\/td>\n<\/tr>\n<tr>\n<td>Mem\u00f3ria<\/td>\n<td>128 GB de HiBL 1.0<\/td>\n<td>144 GB de HiZQ 2.0<\/td>\n<\/tr>\n<tr>\n<td>Largura de banda de mem\u00f3ria<\/td>\n<td>~1,6 TB\/s<\/td>\n<td>~4,0 TB\/s<\/td>\n<\/tr>\n<tr>\n<td>Interconex\u00e3o<\/td>\n<td>2 TB\/s<\/td>\n<td>2 TB\/s<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>O aspecto verdadeiramente not\u00e1vel aqui \u00e9 a mem\u00f3ria. HiBL e HiZQ s\u00e3o mem\u00f3rias de alta largura de banda desenvolvidas internamente pela Huawei \u2014 uma HBM (mem\u00f3ria de largura de banda elevada) dom\u00e9stica, criada porque as restri\u00e7\u00f5es \u00e0s exporta\u00e7\u00f5es impediram o acesso f\u00e1cil \u00e0s mais recentes pilhas fornecidas pela SK Hynix, Micron e Samsung. O fato de um fornecedor chin\u00eas lan\u00e7ar uma HBM competitiva integrada ao pacote j\u00e1 representa um feito de engenharia real, e os 144 GB do 950DT com largura de banda de 4,0 TB\/s situam-se dentro da faixa esperada para uma unidade moderna voltada ao treinamento. A Huawei tamb\u00e9m afirma que a interconex\u00e3o de 2 TB\/s do 950DT \u00e9 cerca de 2,5 vezes maior que a do seu antecessor, o 910C \u2014 mais uma vez, uma informa\u00e7\u00e3o divulgada pela pr\u00f3pria empresa.<\/p>\n<p>Agora, a realidade. A VR200 Rubin da NVIDIA, tamb\u00e9m prevista para o segundo semestre de 2026, tem como meta aproximadamente 35 PFLOPS em FP4 para treinamento e cerca de 50 PFLOPS em FP4 para infer\u00eancia, com 288 GB de HBM4 e largura de banda de aproximadamente 22 TB\/s. (Esses s\u00e3o r\u00f3tulos pr\u00f3prios da NVIDIA \u2014 treinamento versus infer\u00eancia \u2014 e n\u00e3o uma divis\u00e3o densa versus esparsa.) Em termos de desempenho bruto por chip em FP4, isso representa uma lacuna de cerca de 17x a 25x em compara\u00e7\u00e3o com os ~2 PFLOPS de um \u00fanico Ascend 950, dependendo de qual valor da Rubin for considerado. A pr\u00f3pria placa Atlas 350 da Huawei, baseada no 950PR, afirma oferecer 1,56 PFLOPS em FP4 e \"2,8 vezes o desempenho do H20\" \u2014 e mesmo essa compara\u00e7\u00e3o se d\u00e1 com o H20 reduzido e adaptado \u00e0s restri\u00e7\u00f5es de exporta\u00e7\u00e3o, n\u00e3o com uma GPU Blackwell ou Rubin completa, permanecendo ainda uma declara\u00e7\u00e3o da fabricante \u00e0 espera de testes independentes. O resumo justo em uma frase, repetido por analistas especializados em sil\u00edcio, \u00e9 que um \u00fanico Ascend 950 alcan\u00e7a um desempenho aproximadamente equivalente ao da gera\u00e7\u00e3o Hopper da NVIDIA, n\u00e3o ao que a NVIDIA est\u00e1 comercializando em 2026. Para contexto sobre os produtos da NVIDIA, consulte nossa an\u00e1lise da <a href=\"\/pt\/nvidia-vera-rubin-explained-2026\/\">Vera Rubin<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Scale_as_the_strategy\"><\/span>Escala como estrat\u00e9gia<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>A Huawei sabe que n\u00e3o pode vencer a batalha chip a chip, portanto n\u00e3o est\u00e1 tentando faz\u00ea-lo. Sua aposta est\u00e1 na arquitetura de sistema. O SuperPoD Atlas 950 re\u00fane 8.192 aceleradores Ascend 950DT em uma \u00fanica m\u00e1quina l\u00f3gica: aproximadamente 8 EFLOPS em FP8 e 16 EFLOPS em FP4, 1.152 TB de mem\u00f3ria e cerca de 16 PB\/s de largura de banda de interconex\u00e3o atrav\u00e9s de uma malha \u00f3ptica. Ao agrupar 64 desses SuperPoDs em um Atlas 950 SuperCluster, obt\u00e9m-se mais de 520.000 NPUs entregando cerca de 524 EFLOPS em FP8 e aproximadamente 1 zettaflops em FP4. O Atlas 960 SuperCluster, previsto para 2027, avan\u00e7a para o n\u00edvel de um milh\u00e3o de chips e atinge as cifras de 2\/4 zettaflops (FP8\/FP4).<\/p>\n<p>Em compara\u00e7\u00e3o com a NVL144 da NVIDIA, a Huawei afirma que o 950 SuperPoD incorpora aproximadamente uma ordem de grandeza mais aceleradores e cerca de 6,7 vezes mais poder computacional agregado, al\u00e9m de muito mais mem\u00f3ria (cerca de 15 vezes) e largura de banda de interconex\u00e3o. Isso pode ser simultaneamente verdadeiro e enganoso: voc\u00ea est\u00e1 comparando um pod de 8.192 chips com um rack de 144 GPUs. A leitura honesta \u00e9 que, se voc\u00ea tiver espa\u00e7o f\u00edsico ilimitado, energia barata e quantidade suficiente de chips, poder\u00e1 superar um sistema NVIDIA menor e mais eficiente. Esses s\u00e3o tr\u00eas grandes 'se', e o terceiro \u2014 quantidade suficiente de chips \u2014 \u00e9 exatamente onde a hist\u00f3ria se torna dif\u00edcil.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"openPangu_the_model_side\"><\/span>openPangu: o lado dos modelos<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Uma plataforma de chips \u00e9 t\u00e3o \u00fatil quanto o software executado nela, e a Huawei tamb\u00e9m tem estado bastante ativa nesse front. Em sua confer\u00eancia para desenvolvedores (HDC), realizada em junho de 2026, a Huawei lan\u00e7ou <strong>openPangu 2.0<\/strong>: um modelo Pro com 505 bilh\u00f5es de par\u00e2metros totais e 18 bilh\u00f5es ativos, e um modelo Flash com 92 bilh\u00f5es de par\u00e2metros totais \/ 6 bilh\u00f5es ativos, ambos suportando contexto de at\u00e9 512 mil tokens. A Huawei afirma que o modelo Pro duplica aproximadamente o throughput por placa em compara\u00e7\u00e3o com outros modelos de c\u00f3digo aberto l\u00edderes em hardware Ascend \u2014 mais uma vez, uma informa\u00e7\u00e3o da fabricante sobre seu pr\u00f3prio sil\u00edcio, n\u00e3o um resultado validado por benchmarks independentes.<\/p>\n<p>Isso se baseia no Pangu Pro MoE 72B de 2025, que introduziu um design Mixture of Grouped Experts (MoGE) especificamente concebido para equilibrar a carga entre os chips Ascend. O padr\u00e3o \u00e9 intencional: projetar conjuntamente a arquitetura do modelo e o hardware, de modo que as fraquezas do acelerador tenham menor impacto. Trata-se de uma filosofia distinta da abordagem densa-antes-de-esparsa adotada por modelos como <a href=\"\/pt\/deepseek-explained-2026\/\">DeepSeek<\/a>, mas compartilha o mesmo objetivo \u2014 extrair comportamentos pr\u00f3ximos ao estado da arte a partir de recursos computacionais limitados.<\/p>\n<div class=\"convly-procons\">\n<div class=\"pros\">\n<h4>O que est\u00e1 funcionando<\/h4>\n<ul>\n<li>HBM dom\u00e9stica produzida em volume \u2014 um marco real na cadeia de suprimentos<\/li>\n<li>Um roadmap cred\u00edvel e datado, em vez de mera especula\u00e7\u00e3o<\/li>\n<li>A abertura de c\u00f3digo de CANN, Mind e Pangu para atrair desenvolvedores longe da CUDA<\/li>\n<li>Projetos em escala sist\u00eamica que contornam a lacuna por chip<\/li>\n<\/ul>\n<\/div>\n<div class=\"cons\">\n<h4>O que est\u00e1 retendo o progresso<\/h4>\n<ul>\n<li>SMIC limitada a 7 nm; grandes dies apresentam baixo rendimento<\/li>\n<li>O fornecimento de HBM \u00e9 o verdadeiro limite para a quantidade de chips embarcados<\/li>\n<li>O desempenho por chip fica atr\u00e1s da NVIDIA em cerca de 5x no TPP (Total Processing Performance)<\/li>\n<li>As vers\u00f5es de 2026 regrediram em rela\u00e7\u00e3o ao pr\u00f3prio 910C de 2025 no TPP<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_open-source_play\"><\/span>A iniciativa de c\u00f3digo aberto<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>O esfor\u00e7o no software \u00e9 a parte mais prov\u00e1vel de fazer a diferen\u00e7a a longo prazo. Na Huawei Connect, a empresa comprometeu-se a abrir integralmente sua pilha de software at\u00e9 31 de dezembro de 2025: o <strong>CANN<\/strong> kit de ferramentas para computa\u00e7\u00e3o heterog\u00eanea (sua resposta \u00e0 CUDA), as ferramentas e ambiente de desenvolvimento da s\u00e9rie <strong>Mind<\/strong> e os modelos-base <strong>openPangu<\/strong> . Eric Xu descreveu esse esfor\u00e7o como um projeto de longo prazo, com a Huawei se comprometendo a investir cerca de 15 bilh\u00f5es de yuans (aproximadamente US$ 2,1 bilh\u00f5es) por ano, durante cinco anos, no ecossistema e na computa\u00e7\u00e3o aberta.<\/p>\n<p>A l\u00f3gica \u00e9 s\u00f3lida. A verdadeira vantagem competitiva da NVIDIA n\u00e3o est\u00e1 no sil\u00edcio, mas na CUDA e nas d\u00e9cadas de bibliotecas constru\u00eddas sobre ela. Se a Huawei quiser que o Ascend seja mais do que uma plataforma cativa para hiperscalers chineses, precisa tornar a migra\u00e7\u00e3o simples e dar aos desenvolvedores acesso ao c\u00f3digo-fonte. Se isso ser\u00e1 bem-sucedido \u00e9 uma quest\u00e3o emp\u00edrica que voc\u00ea poder\u00e1 avaliar nos pr\u00f3ximos meses observando sinais no GitHub \u2014 pull requests ativas, lan\u00e7amentos regulares e kernels mantidos pela comunidade. As interfaces do compilador e o conjunto de instru\u00e7\u00f5es virtuais do CANN est\u00e3o programados para serem abertos (juntamente com a total abertura de c\u00f3digo do CANN); a prova vir\u00e1 com a ado\u00e7\u00e3o por terceiros fora dos pr\u00f3prios clientes da Huawei.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_constraints_Huawei_didnt_dwell_on\"><\/span>As restri\u00e7\u00f5es que a Huawei n\u00e3o destacou<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Aqui est\u00e1 o cerne inc\u00f4modo. Todos os n\u00fameros impressionantes listados acima esbarram na mesma barreira: a Huawei n\u00e3o consegue fabricar quantidades suficientes desses chips em um n\u00f3 de processo competitivo.<\/p>\n<p>A SMIC est\u00e1 presa em um processo de classe 7 nm porque as restri\u00e7\u00f5es \u00e0s exporta\u00e7\u00f5es impedem a entrada da litografia EUV na China, e o rendimento de grandes dies de IA nesse n\u00f3 \u00e9 fraco. Pior ainda, <strong>a HBM \u00e9 o gargalo<\/strong> \u2014 mais limitante do que a pr\u00f3pria produ\u00e7\u00e3o dos dies. Segundo estimativa da SemiAnalysis, o fabricante chin\u00eas de mem\u00f3ria CXMT conseguir\u00e1 produzir apenas cerca de 2 milh\u00f5es de pilhas de HBM no pr\u00f3ximo ano, o suficiente para aproximadamente 250.000\u2013300.000 chips da classe Ascend, mesmo que a SMIC pudesse fabricar dies para mais de um milh\u00e3o de unidades. Sem essas pilhas, os aceleradores acabados n\u00e3o podem ser embarcados, n\u00e3o importa quantos dies de processamento a SMIC produza.<\/p>\n<p>A matem\u00e1tica de desempenho decorre diretamente disso. Analistas do Council on Foreign Relations estimam que os melhores chips de IA norte-americanos s\u00e3o atualmente cerca de cinco vezes mais potentes que os melhores da Huawei em termos de desempenho total de processamento (TPP), com essa lacuna ampliando-se para aproximadamente dezessete vezes at\u00e9 o segundo semestre de 2027. Em termos de produ\u00e7\u00e3o agregada, o cen\u00e1rio mais favor\u00e1vel \u00e0 Huawei, segundo o CFR, ainda prev\u00ea que ela produzir\u00e1 apenas cerca de 5% do poder computacional de IA total da NVIDIA em 2026, caindo para cerca de 2% em 2027 \u2014 e sua estimativa mediana \u00e9 muito menor, em torno de 1%. O mais revelador: os Ascend 950PR e 950DT de 2026 t\u00eam, na verdade, <em>desempenho inferior<\/em> ao do Ascend 910C de 2025 \u2014 um sinal de qu\u00e3o dif\u00edcil \u00e9 a produ\u00e7\u00e3o dom\u00e9stica \u2014 e, segundo o pr\u00f3prio roadmap da Huawei, a primeira pe\u00e7a capaz de superar o H200 em desempenho ou largura de banda de mem\u00f3ria ser\u00e1 o Ascend 960, previsto para o quarto trimestre de 2027. Se voc\u00ea est\u00e1 escolhendo hardware para executar modelos localmente hoje, nosso <a href=\"\/pt\/best-gpus-for-local-llms-2026\/\">guia das melhores GPUs para LLMs locais<\/a> \u00e9 um ponto de partida mais pr\u00e1tico do que qualquer item deste roadmap.<\/p>\n<p>Nada disso significa que o esfor\u00e7o seja mera encena\u00e7\u00e3o. Jensen Huang, da NVIDIA, j\u00e1 chamou a Huawei repetidamente de \"formid\u00e1vel\" \u2014 em maio de 2026, afirmou que a NVIDIA \"largamente cedeu\" o mercado avan\u00e7ado de chips de IA da China para a Huawei. A competi\u00e7\u00e3o \u00e9 real; o que a matem\u00e1tica da fabrica\u00e7\u00e3o mostra \u00e9 que o cronograma \u00e9 o fator a observar, e cronogramas em n\u00f3s tecnol\u00f3gicos restritos tendem a sofrer atrasos.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>Perguntas frequentes<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>O Ascend 950 da Huawei \u00e9 melhor que os chips Blackwell ou Rubin da NVIDIA?<\/h3>\n<p>N\u00e3o, n\u00e3o por chip. Um \u00fanico Ascend 950 alcan\u00e7a desempenho equivalente \u00e0 gera\u00e7\u00e3o Hopper \u2014 aproximadamente 1 PFLOPS em FP8 e 2 PFLOPS em FP4 \u2014 enquanto a VR200 Rubin da NVIDIA tem como meta cerca de 35 PFLOPS em FP4 para treinamento e 50 PFLOPS para infer\u00eancia. O argumento da Huawei est\u00e1 no n\u00edvel do sistema: conectar milhares de chips e superar um rack NVIDIA menor em termos de desempenho agregado.<\/p>\n<h3>Quando o Ascend 950DT ser\u00e1 realmente disponibilizado?<\/h3>\n<p>Ele chegar\u00e1 \u00e0 Huawei Cloud em agosto de 2026 como um servi\u00e7o acess\u00edvel via nuvem, com lan\u00e7amento comercial completo (placas e servidores SuperPoD) previsto para o quarto trimestre de 2026. O 950PR come\u00e7ou a ser embarcado anteriormente, no primeiro trimestre de 2026.<\/p>\n<h3>O que \u00e9 openPangu e como ele difere do Pangu Pro MoE 72B?<\/h3>\n<p>openPangu 2.0, lan\u00e7ado na HDC 2026, \u00e9 a mais recente fam\u00edlia de c\u00f3digo aberto: um modelo Pro com 505 bilh\u00f5es de par\u00e2metros (18 bilh\u00f5es ativos) e um modelo Flash com 92 bilh\u00f5es de par\u00e2metros (6 bilh\u00f5es ativos), ambos com contexto de 512 mil tokens. O Pangu Pro MoE 72B de 2025 foi o modelo anterior que introduziu a arquitetura Mixture of Grouped Experts, otimizada especificamente para os chips Ascend.<\/p>\n<h3>A Huawei consegue fabricar quantidade suficiente de chips Ascend para fazer diferen\u00e7a?<\/h3>\n<p>Esse \u00e9 o verdadeiro limite. Segundo estimativa da SemiAnalysis, o fornecimento de HBM limita a produ\u00e7\u00e3o a aproximadamente 250.000\u2013300.000 chips da classe Ascend por ano, e os rendimentos da SMIC em 7 nm s\u00e3o fracos. Mesmo o cen\u00e1rio mais favor\u00e1vel \u00e0 Huawei, segundo o CFR, prev\u00ea que ela fornecer\u00e1 apenas cerca de 5% do poder computacional de IA agregado da NVIDIA em 2026, com a estimativa mediana mais pr\u00f3xima de 1%.<\/p>\n<h3>O que s\u00e3o as mem\u00f3rias HiBL e HiZQ?<\/h3>\n<p>S\u00e3o mem\u00f3rias de alta largura de banda desenvolvidas internamente pela Huawei, criadas porque as restri\u00e7\u00f5es \u00e0s exporta\u00e7\u00f5es limitam o acesso \u00e0s mais recentes solu\u00e7\u00f5es de HBM de terceiros. O 950PR utiliza 128 GB de HiBL 1.0 (~1,6 TB\/s); o 950DT utiliza 144 GB de HiZQ 2.0 (~4,0 TB\/s).<\/p>\n<h3>Por que a Huawei est\u00e1 abrindo o c\u00f3digo do CANN e dos modelos Pangu?<\/h3>\n<p>Para quebrar o bloqueio de software da NVIDIA. A CUDA \u00e9 a verdadeira vantagem competitiva da NVIDIA, portanto a Huawei est\u00e1 abrindo o c\u00f3digo do CANN (sua alternativa \u00e0 CUDA), da cadeia de ferramentas Mind e dos modelos Pangu, a fim de reduzir os custos de migra\u00e7\u00e3o e construir um ecossistema de desenvolvedores em torno do Ascend.<\/p>\n<h3>O que exatamente significa \"4 zettaflops at\u00e9 2028\"?<\/h3>\n<p>Trata-se de uma meta em n\u00edvel de sistema para o Atlas 960 SuperCluster \u2014 um cluster com um milh\u00e3o de placas \u2014 na precis\u00e3o FP4, e n\u00e3o de um \u00fanico chip. Os aceleradores Ascend individuais s\u00e3o medidos em petaflops, tr\u00eas ordens de grandeza inferiores.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Conclus\u00e3o<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Os an\u00fancios da Huawei para 2026 s\u00e3o ao mesmo tempo s\u00e9rios e restritos. A roadmap \u00e9 real, a mem\u00f3ria HBM desenvolvida internamente representa um marco genu\u00edno, os modelos openPangu e a abertura do c\u00f3digo-fonte do CANN s\u00e3o movimentos inteligentes para minar gradualmente a vantagem de software da NVIDIA, e a expans\u00e3o em escala do SuperPoD \u00e9 uma estrat\u00e9gia engenhosa para contornar as limita\u00e7\u00f5es do sil\u00edcio. Avalie tudo isso com seriedade.<\/p>\n<p>Em seguida, leia a letra mi\u00fada. Por chip, o Ascend 950 \u00e9 uma pe\u00e7a da era Hopper lan\u00e7ada em um ano da era Rubin, e at\u00e9 mesmo a pr\u00f3pria roadmap da Huawei mostra que os chips de 2026 apresentam uma regress\u00e3o no desempenho total em compara\u00e7\u00e3o com o 910C de 2025. A restri\u00e7\u00e3o fundamental n\u00e3o \u00e9 a ambi\u00e7\u00e3o ou o talento de projeto \u2014 \u00e9 o teto de 7 nm e o fornecimento de HBM capaz de alimentar apenas algumas centenas de milhares de chips por ano. Para compradores chineses impedidos de adquirir produtos da NVIDIA, o Ascend \u00e9 a melhor op\u00e7\u00e3o dispon\u00edvel e est\u00e1 melhorando; o pr\u00f3prio CEO da NVIDIA chama a Huawei de \"formid\u00e1vel\" e admite que a empresa praticamente cedeu esse mercado. Para todos os observadores da corrida global, o veredito honesto \u00e9 que a Huawei chegou como uma concorrente real, mas os chips, os \u00edndices de produ\u00e7\u00e3o (yields) e o cronograma ainda favorecem a NVIDIA \u2014 e continuar\u00e3o assim at\u00e9 2027, a menos que a situa\u00e7\u00e3o de fabrica\u00e7\u00e3o mude.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Artigos relacionados<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/pt\/npu-vs-gpu-for-ai-2026\/\">NPU versus GPU para IA: Qual \u00e9 a diferen\u00e7a? (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/pt\/china-ai-strategy\/\">IA da China em 2026: os modelos, laborat\u00f3rios e estrat\u00e9gia de c\u00f3digo aberto<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/pt\/kimi-k2-7-code-explained-2026\/\">Explicando o Kimi K2.7 Code: Modelo Aberto de Programa\u00e7\u00e3o de 1 trilh\u00e3o de par\u00e2metros da Moonshot<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>Huawei has turned its AI silicon plans into a dated, one-chip-a-year roadmap, opened the openPangu 2.0 models, and committed to open-sourcing CANN. We weigh all of it against the constraints the keynote skipped: a 7nm ceiling at SMIC, a homegrown HBM supply that can feed only a few hundred thousand chips, and a per-chip gap to NVIDIA that Huawei&#8217;s own roadmap admits.<\/p>","protected":false},"author":1,"featured_media":1183,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[245],"tags":[757,776,420,780,775,778,777,779],"class_list":["post-1178","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-chips","tag-ai-chips","tag-ascend-950","tag-china-ai","tag-hbm","tag-huawei","tag-nvidia","tag-pangu","tag-smic"],"_links":{"self":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts\/1178","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/comments?post=1178"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts\/1178\/revisions"}],"predecessor-version":[{"id":1186,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts\/1178\/revisions\/1186"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/media\/1183"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/media?parent=1178"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/categories?post=1178"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/tags?post=1178"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}