Is the Huawei Ascend 950 better than NVIDIA's Blackwell or Rubin?

No, not per chip. A single Ascend 950 lands around Hopper-class performance — roughly 1 PFLOPS FP8 and 2 PFLOPS FP4 — while NVIDIA's Rubin VR200 targets about 35 PFLOPS of FP4 for training and 50 PFLOPS for inference. Huawei's argument is at the system level: wire thousands of chips together and beat a smaller NVIDIA rack on aggregate.

When does the Ascend 950DT actually ship?

It reaches Huawei Cloud in August 2026 as a cloud-accessible service, with a full commercial launch (cards and SuperPoD servers) slated for Q4 2026. The 950PR began shipping earlier, in Q1 2026.

What is openPangu and how is it different from Pangu Pro MoE 72B?

openPangu 2.0, released at HDC 2026, is the latest open-source family: a 505B-parameter Pro model (18B active) and a 92B Flash model (6B active), both with 512K context. The 2025 Pangu Pro MoE 72B was the earlier model that introduced the Mixture of Grouped Experts architecture tuned for Ascend.

Can Huawei make enough Ascend chips to matter?

That is the real limit. By SemiAnalysis's estimate, HBM supply caps output at roughly 250,000–300,000 Ascend-class chips a year, and SMIC's 7nm yields are weak. Even the most Huawei-favorable CFR scenario has it fielding only about 5% of NVIDIA's aggregate AI compute in 2026, with the median estimate closer to 1%.

What are HiBL and HiZQ memory?

They are Huawei's homegrown high-bandwidth memory, developed because export controls restrict access to the latest third-party HBM. The 950PR uses 128 GB of HiBL 1.0 (~1.6 TB/s); the 950DT uses 144 GB of HiZQ 2.0 (~4.0 TB/s).

Why is Huawei open-sourcing CANN and the Pangu models?

To break NVIDIA's software lock-in. CUDA is NVIDIA's real moat, so Huawei is opening CANN (its CUDA equivalent), the Mind toolchain, and the Pangu models to lower the cost of porting and build a developer ecosystem around Ascend.

What does "4 zettaflops by 2028" actually refer to?

It is a system-level target for the Atlas 960 SuperCluster — a million-card cluster — at FP4 precision, not a single chip. Individual Ascend accelerators are measured in petaflops, three orders of magnitude lower.

Huawei Ascend 950 y Pangu: La apuesta de China en chips de IA para 2026

Huawei ha dedicado los últimos nueve meses a transformar sus planes de silicio para IA en un calendario concreto. En la conferencia Huawei Connect del pasado mes de septiembre publicó una hoja de ruta de cuatro chips Ascend; en la conferencia Huawei Cloud INSPIRE Creators celebrada este junio asignó una fecha cercana a la parte más importante de dicha hoja de ruta. El Ascend 950DT, miembro de la familia 950 destinado al entrenamiento y la decodificación, estará disponible en Huawei Cloud en agosto de 2026, con su lanzamiento comercial completo en el cuarto trimestre de 2026. Chen Lin, vicepresidente de la compañía, resumió esta cadencia como «una generación por año, duplicando la potencia informática».

Esa es la propuesta. Este artículo analiza hasta qué punto es realista. Examinaremos la hoja de ruta de chips y sus especificaciones reales, los modelos openPangu entrenados sobre Ascend, el impulso de código abierto previsto para finales de año en torno a CANN y la cadena de herramientas Mind, y las limitaciones que nadie mencionó durante la presentación: un techo tecnológico de 7 nm en SMIC, una oferta interna de HBM que no logra satisfacer la demanda, y una brecha por chip respecto a NVIDIA que la propia hoja de ruta reconoce discretamente.

Conclusiones clave

Un chip por año, cada uno aproximadamente el doble del anterior. Ascend 950PR (primer trimestre de 2026), Ascend 950DT (nube en agosto de 2026, lanzamiento comercial en el cuarto trimestre de 2026), Ascend 960 (cuarto trimestre de 2027), Ascend 970 (cuarto trimestre de 2028), con el objetivo de alcanzar un rendimiento agregado de 4 zettaflops FP4 a nivel de sistema para 2028.
El 950 es un chip equivalente al Hopper, no un competidor directo del Blackwell. Por chip ofrece aproximadamente 1 PFLOPS en FP8 / 2 PFLOPS en FP4, con 128–144 GB de HBM propia de Huawei: una cifra sólida, pero solo una fracción de una sola GPU NVIDIA Rubin .
El verdadero arma de Huawei es la escala. El Atlas 950 SuperPoD conecta 8.192 chips y afirma superar, mediante fuerza bruta, al NVL144 de NVIDIA en potencia informática agregada, memoria y ancho de banda.
openPangu 2.0 se hizo público en la HDC 2026. Un modelo Pro de 505.000 millones de parámetros (18.000 millones activos) y un modelo Flash de 92.000 millones de parámetros (6.000 millones activos), ambos con contexto de 512K, cuyos siete componentes se liberarán a partir del 30 de junio.
La limitación real es la fabricación. SMIC sigue estancada en el nodo de 7 nm y la HBM desarrollada internamente constituye el cuello de botella; incluso en el escenario más favorable para Huawei según los analistas, su capacidad informática total en IA apenas alcanzará el 5 % de la de NVIDIA en 2026, y la estimación mediana es mucho más baja.
Incluso la propia hoja de ruta de Huawei muestra una regresión en 2026. El 950PR y el 950DT tienen un rendimiento de procesamiento total inferior al del Ascend 910C de 2025; según el plan mismo de Huawei, el primer chip capaz de superar al H200 será el 960, en el cuarto trimestre de 2027.

La hoja de ruta: una generación por año

El planteamiento de Huawei es metrónomico: cuatro partes, una por año, cada una aproximadamente el doble de la anterior:

Ascend 950PR — primer trimestre de 2026, prellenado y recomendación
Ascend 950DT — nube en agosto de 2026, lanzamiento comercial en el cuarto trimestre de 2026, decodificación y entrenamiento
Ascend 960 — cuarto trimestre de 2027
Ascend 970 — cuarto trimestre de 2028

Los sufijos «PR» y «DT» son lo más interesante. En lugar de lanzar un acelerador de propósito general, Huawei dividió la inferencia en dos partes. El 950PR está optimizado para la fase de prellenado —el paso intensivo en cómputo sobre su indicación— y para sistemas de recomendación. El 950DT gestiona la decodificación (generación token por token) y el entrenamiento continuo, razón por la cual dispone de una memoria más amplia. Si ha leído nuestra explicación sobre NPU frente a GPU, esta es una idea familiar llevada aún más lejos: especializar el silicio según la fase de la carga de trabajo.

La cifra principal —aproximadamente 4 zettaflops FP4 para 2028— es un objetivo a nivel de sistema para el Atlas 960 SuperCluster, no para un único chip. Tenga siempre presente esta distinción cada vez que vea una cifra expresada en zettaflops asociada a Huawei; esos números impresionantes describen siempre un edificio lleno de aceleradores, no el acelerador individual.

Qué es realmente el Ascend 950

A continuación se muestran las especificaciones por chip que Huawei ha revelado. Se trata de cifras proporcionadas por el fabricante para componentes que, a mediados de junio de 2026, solo se encuentran parcialmente disponibles en el mercado, por lo que deben considerarse objetivos más que resultados verificados mediante pruebas de referencia.

Especificaciones	Ascend 950PR	Ascend 950DT
Disponibilidad	Primer trimestre de 2026	Nube en agosto de 2026, lanzamiento comercial en el cuarto trimestre de 2026
Función	Prefllenado / recomendación	Decodificación / entrenamiento
Cómputo FP8	~1 PFLOPS	~1 PFLOPS
Cómputo FP4	~2 PFLOPS	~2 PFLOPS
Memoria	128 GB de HiBL 1.0	144 GB de HiZQ 2.0
Ancho de banda de memoria	~1,6 TB/s	~4,0 TB/s
Interconexión	2 TB/s	2 TB/s

Lo verdaderamente notable aquí es la memoria. HiBL y HiZQ son memorias de alto ancho de banda propias de Huawei — una HBM desarrollada internamente, creada porque las restricciones a las exportaciones impidieron el acceso sencillo a las últimas generaciones de HBM de SK Hynix, Micron y Samsung. Que un fabricante chino entregue una HBM competitiva integrada en el paquete constituye un logro de ingeniería real, y los 144 GB a 4,0 TB/s del 950DT se sitúan dentro del rango adecuado para una unidad moderna de entrenamiento. Huawei afirma además que la interconexión de 2 TB/s del 950DT es aproximadamente 2,5 veces mayor que la de su predecesor, el 910C — otra cifra proporcionada por el fabricante.

Ahora, la realidad. La VR200 Rubin de NVIDIA, también prevista para la segunda mitad de 2026, tiene como objetivo unos 35 PFLOPS de FP4 para entrenamiento y alrededor de 50 PFLOPS de FP4 para inferencia, con 288 GB de HBM4 a aproximadamente 22 TB/s. (Esas son etiquetas oficiales de NVIDIA —entrenamiento frente a inferencia—, no una división densa frente a dispersa.) En términos de FP4 bruto por chip, esto representa una brecha de aproximadamente 17× a 25× respecto a los ~2 PFLOPS de un único Ascend 950, dependiendo de qué cifra de Rubin se tome como referencia. La propia tarjeta Atlas 350 de Huawei, basada en el 950PR, afirma ofrecer 1,56 PFLOPS de FP4 y «2,8 veces la potencia del H20» —y aun así esta comparación se hace con el H20 reducido y adaptado a las restricciones de exportación, no con una GPU Blackwell o Rubin completa, y sigue siendo una afirmación del fabricante que espera validación independiente. El resumen objetivo en una sola línea, respaldado por analistas especializados en semiconductores, es que un único Ascend 950 alcanza una capacidad aproximada equivalente a la generación Hopper de NVIDIA, no a lo que NVIDIA ofrece en 2026. Para contexto sobre la oferta de NVIDIA, véase nuestro análisis de la VR200 Vera Rubin.

La escala como estrategia

Huawei sabe que no puede ganar la batalla chip contra chip, así que no lo intenta. Su apuesta está en la arquitectura del sistema. El SuperPoD Atlas 950 integra 8.192 aceleradores Ascend 950DT en una única máquina lógica: aproximadamente 8 EFLOPS de FP8 y 16 EFLOPS de FP4, 1.152 TB de memoria y unos 16 PB/s de ancho de banda de interconexión a través de una red óptica. Al ensamblar 64 de estos SuperPoD en un Atlas 950 SuperCluster se obtienen más de 520.000 NPUs que suministran cerca de 524 EFLOPS de FP8 y aproximadamente 1 zettaflop de FP4. El Atlas 960 SuperCluster de 2027 escala hasta el nivel de un millón de tarjetas y alcanza las cifras de 2/4 zettaflops (FP8/FP4).

Frente al NVL144 de NVIDIA, Huawei afirma que el 950 SuperPoD incorpora aproximadamente un orden de magnitud más aceleradores y alrededor de 6,7 veces más potencia computacional agregada, con mucha más memoria (cerca de 15 veces) y ancho de banda de interconexión. Esto puede ser simultáneamente cierto y engañoso: se está comparando un pod de 8.192 chips con un rack de 144 GPUs. La lectura honesta es que, si se dispone de espacio ilimitado en el centro de datos, energía barata y suficientes chips, es posible superar con fuerza bruta a un sistema NVIDIA más pequeño y eficiente. Esas son tres grandes incógnitas, y la tercera —suficientes chips— es precisamente donde la historia se complica.

openPangu: el lado de los modelos

Una plataforma de chips solo es tan útil como el software que se ejecuta sobre ella, y Huawei también ha estado muy activa en este frente. En su conferencia para desarrolladores (HDC) de junio de 2026, Huawei lanzó openPangu 2.0: un modelo Pro con 505.000 millones de parámetros totales y 18.000 millones activos, y un modelo Flash con 92.000 millones totales / 6.000 millones activos, ambos compatibles con contextos de hasta 512 K tokens. Huawei afirma que el modelo Pro duplica aproximadamente el rendimiento por tarjeta frente a otros modelos de código abierto líderes en hardware Ascend —una vez más, una cifra del fabricante obtenida sobre su propio silicio, no un resultado validado mediante benchmarks independientes.

Esto se construye sobre el Pangu Pro MoE 72B de 2025, que introdujo un diseño de Mezcla de Expertos Agrupados (MoGE) específicamente concebido para equilibrar la carga entre los chips Ascend. El patrón es deliberado: diseñar conjuntamente la arquitectura del modelo y el hardware, de modo que las debilidades del acelerador tengan menor impacto. Se trata de una filosofía distinta del enfoque denso-después-escaso empleado en modelos como DeepSeek, pero comparte el mismo objetivo: extraer comportamientos cercanos al estado del arte a partir de recursos computacionales limitados.

Qué funciona

HBM producida internamente a escala industrial —un hito real en la cadena de suministro
Una hoja de ruta creíble y con fechas definidas, no un proyecto vaporoso
La liberación bajo licencia abierta de CANN, Mind y Pangu para atraer desarrolladores lejos de CUDA
Diseños a escala de sistema que evitan la brecha por chip

Qué lo frena

SMIC limitada a 7 nm; los dies grandes presentan bajos rendimientos
El suministro de HBM es el verdadero techo para la cantidad de chips que se pueden entregar
El rendimiento por chip se queda atrás respecto a NVIDIA en aproximadamente un factor 5 en TPP
Las piezas de 2026 retroceden respecto al 910C de 2025 en TPP

La apuesta por el código abierto

El impulso en el software es la parte que probablemente tendrá mayor relevancia a largo plazo. En Huawei Connect, la empresa se comprometió a abrir su pila completa antes del 31 de diciembre de 2025: el CANN kit de herramientas para cómputo heterogéneo (su respuesta a CUDA), las cadenas de herramientas y el entorno de desarrollo de la serie Mind y los modelos fundamentales openPangu . Eric Xu lo presentó como un proyecto a largo plazo, con el compromiso de Huawei de invertir aproximadamente 15.000 millones de yuanes (unos 2.100 millones de dólares estadounidenses) anuales durante cinco años en el ecosistema y la computación abierta.

La lógica es sólida. La verdadera ventaja competitiva de NVIDIA no radica en su silicio, sino en CUDA y en la década de bibliotecas construidas sobre él. Si Huawei quiere que Ascend sea algo más que una plataforma cautiva para los hiperscaladores chinos, debe facilitar enormemente la migración y otorgar a los desarrolladores acceso al código fuente. Si esto prospera o no es una cuestión empírica que podrá responderse en los próximos meses observando las señales de GitHub —pull requests activas, lanzamientos regulares, kernels mantenidos por la comunidad. Las interfaces del compilador de CANN y su conjunto de instrucciones virtuales están programadas para abrirse (junto con el resto de CANN completamente liberado); la prueba definitiva será la adopción por terceros fuera de los propios clientes de Huawei.

Las limitaciones que Huawei no destacó

Aquí radica el núcleo incómodo. Cada impresionante cifra anterior tropieza con la misma barrera: Huawei no puede fabricar suficientes de estos chips en un nodo de proceso competitivo.

SMIC permanece estancada en un nodo de clase 7 nm debido a que las restricciones a las exportaciones impiden la llegada de litografía EUV a China, y los rendimientos de los grandes dies de IA en ese nodo son pobres. Peor aún, la HBM es el cuello de botella —más restrictivo incluso que la producción de los dies mismos. Según estimaciones de SemiAnalysis, el fabricante chino de memoria CXMT solo podrá producir alrededor de 2 millones de pilas de HBM el próximo año, suficientes para aproximadamente 250.000–300.000 chips de tipo Ascend, aunque SMIC podría fabricar dies para más de un millón. Sin pilas de memoria, los aceleradores terminados no pueden enviarse, sin importar cuántos dies de cómputo produzca SMIC.

Las matemáticas del rendimiento derivan directamente de ello. Analistas del Consejo de Relaciones Exteriores (CFR) estiman que los mejores chips de IA estadounidenses actuales son actualmente unas cinco veces más potentes que los mejores de Huawei en términos de rendimiento total de procesamiento (TPP), una brecha que se ampliará a aproximadamente diecisiete veces en la segunda mitad de 2027. En cuanto a la producción agregada, el escenario más favorable para Huawei según el CFR aún sitúa su producción total de cómputo de IA en 2026 en apenas un 5 % de la de NVIDIA, descendiendo al 2 % en 2027 —y su estimación mediana es mucho más baja, alrededor del 1 %. Lo más revelador: el Ascend 950PR y el 950DT de 2026 tienen efectivamente menor TPP que el Ascend 910C de 2025 —una señal clara de la dificultad de la producción nacional— y, según la hoja de ruta oficial de Huawei, la primera pieza capaz de superar al H200 tanto en rendimiento como en ancho de banda de memoria será el Ascend 960 en el cuarto trimestre de 2027. Si usted está eligiendo hardware para ejecutar modelos localmente hoy mismo, nuestra guía de las mejores GPU para LLM locales guía práctica

es un punto de partida más realista que cualquier elemento de esta hoja de ruta. Ninguno de estos aspectos significa que el esfuerzo sea mera fachada. Jensen Huang, de NVIDIA, ha calificado repetidamente a Huawei como «formidable» —en mayo de 2026 afirmó que NVIDIA ha «cedido en gran medida» el mercado chino de chips avanzados de IA a Huawei. La competencia es real; lo que las matemáticas de fabricación demuestran es que el factor clave a vigilar es el cronograma, y los cronogramas en nodos tecnológicos restringidos suelen retrasarse.

Preguntas frecuentes

¿Es el Ascend 950 de Huawei mejor que los chips Blackwell o Rubin de NVIDIA?

No, no por chip. Un único Ascend 950 alcanza un rendimiento similar al de la generación Hopper —aproximadamente 1 PFLOPS de FP8 y 2 PFLOPS de FP4—, mientras que la VR200 Rubin de NVIDIA tiene como objetivo unos 35 PFLOPS de FP4 para entrenamiento y 50 PFLOPS para inferencia. El argumento de Huawei se centra en el nivel de sistema: conectar miles de chips y superar a un rack NVIDIA más pequeño en términos de potencia computacional agregada.

¿Cuándo se comercializará realmente el Ascend 950DT?

Llegará a Huawei Cloud en agosto de 2026 como servicio accesible en la nube, con su lanzamiento comercial completo (tarjetas y servidores SuperPoD) previsto para el cuarto trimestre de 2026. El 950PR comenzó a comercializarse antes, en el primer trimestre de 2026.

¿Qué es openPangu y cómo se diferencia del Pangu Pro MoE 72B?

openPangu 2.0, lanzado en la HDC 2026, es la última familia de código abierto: un modelo Pro de 505.000 millones de parámetros (18.000 millones activos) y un modelo Flash de 92.000 millones (6.000 millones activos), ambos con contexto de 512 K tokens. El Pangu Pro MoE 72B de 2025 fue el modelo anterior que introdujo la arquitectura de Mezcla de Expertos Agrupados (MoGE), optimizada específicamente para Ascend.

¿Puede Huawei fabricar suficientes chips Ascend para tener relevancia?

Ese es el verdadero límite. Según estimaciones de SemiAnalysis, el suministro de HBM limita la producción anual a aproximadamente 250.000–300.000 chips de tipo Ascend, y los rendimientos de SMIC en 7 nm son débiles. Incluso el escenario más favorable para Huawei según el CFR sitúa su cómputo de IA agregado en 2026 en apenas un 5 % del de NVIDIA, mientras que su estimación mediana se acerca más al 1 %.

¿Qué son las memorias HiBL y HiZQ?

Son memorias de alto ancho de banda desarrolladas internamente por Huawei, creadas porque las restricciones a las exportaciones limitan el acceso a las últimas generaciones de HBM de terceros. El 950PR utiliza 128 GB de HiBL 1.0 (~1,6 TB/s); el 950DT emplea 144 GB de HiZQ 2.0 (~4,0 TB/s).

¿Por qué Huawei está liberando bajo licencia abierta CANN y los modelos Pangu?

Para romper el bloqueo de software de NVIDIA. CUDA es la verdadera ventaja competitiva de NVIDIA, por lo que Huawei está abriendo CANN (su equivalente a CUDA), la cadena de herramientas Mind y los modelos Pangu para reducir los costos de migración y construir un ecosistema de desarrolladores alrededor de Ascend.

¿A qué se refiere exactamente la afirmación «4 zettaflops para 2028»?

Se trata de un objetivo a nivel de sistema para el superclúster Atlas 960 —un clúster de un millón de tarjetas— en precisión FP4, no de un chip individual. Los aceleradores Ascend individuales se miden en petaflops, tres órdenes de magnitud por debajo.

Conclusión final

Los anuncios de Huawei para 2026 son tan serios como limitados. La hoja de ruta es real, la memoria HBM desarrollada internamente constituye un hito genuino, los modelos openPangu y la liberación de código abierto de CANN son movimientos inteligentes destinados a erosionar la ventaja de software de NVIDIA, y la escalabilidad del SuperPoD es una estrategia ingeniosa para sortear las limitaciones del silicio. Todo ello debe tomarse al pie de la letra.

Luego, léase la letra pequeña. Por chip, el Ascend 950 es una pieza de la era Hopper que llega en un año de la era Rubin, e incluso la propia hoja de ruta de Huawei muestra una regresión en el rendimiento total de los chips de 2026 frente al Ascend 910C de 2025. La restricción fundamental no es la ambición ni el talento en diseño, sino un techo tecnológico de 7 nm y una oferta de HBM capaz de abastecer únicamente a unos cientos de miles de chips al año. Para los compradores chinos excluidos de NVIDIA, Ascend es la mejor opción disponible y está mejorando; incluso el propio CEO de NVIDIA califica a Huawei de «formidable» y reconoce que su empresa ha cedido prácticamente por completo ese mercado. Para quienes observan la carrera global, el veredicto sincero es que Huawei ha llegado como un competidor real, pero los chips, los rendimientos de fabricación y el calendario siguen favoreciendo a NVIDIA —y así seguirán hasta 2027, a menos que cambie la situación en la fabricación.