DeepSeek V4-Pro vs. DeepSeek V4-Flash — DeepSeek’s flagship versus its budget Flash model. Below is the full side-by-side: specifications, API pricing, context window, local hardware requirements, and a clear, data-driven recommendation on which to pick.

Especificações	DeepSeek V4-Pro	DeepSeek V4-Flash
Desenvolvedor	DeepSeek	DeepSeek
Tipo	LLM (MoE)	LLM (MoE)
Parâmetros	1,6 trilhão no total / ~49 bilhões ativos (MoE)	284B no total / ~13B ativos (MoE)
Janela de contexto	1 milhão	1 milhão
Modalidade	Texto → Texto	Texto → Texto
Licença	MIT (aberta)	MIT (aberta)
Pesos abertos	✅ Sim	✅ Sim
Preço de entrada (US$ / 1 milhão)	$0.435	$0.14
Preço de saída (US$ / 1 milhão)	$0.87	$0.28
VRAM (4 bits)	~800 GB	~140 GB
GPU mínima (local)	Servidor com múltiplas GPUs (ex.: 8× H100 de 80 GB)	2× H100 80 GB (4 bits)
Lançado	2026-04	2026-04

Principais diferenças

Custo: DeepSeek V4-Flash is 211% cheaper than DeepSeek V4-Pro on a blended-token basis.
Abertura: ambos possuem pesos abertos, portanto podem ser auto-hospedados ou ajustados. Compare suas necessidades de VRAM acima para saber qual GPU você pode usar.
Run DeepSeek V4-Pro locally: ~~800 GB at 4-bit (min Multi-GPU server (e.g. 8× H100 80GB)).
Run DeepSeek V4-Flash locally: ~~140 GB at 4-bit (min 2× H100 80GB (4-bit)).

Qual você deve escolher?

Choose DeepSeek V4-Pro if it fits your existing stack or you prefer DeepSeek.

Choose DeepSeek V4-Flash se você deseja um custo menor por token para cargas de trabalho de alto volume.

→ Estime custos reais no calculador de custos da API · verifique o hardware local no Calculadora de VRAM · navegue por todos os 30+ modelos.

Todas as especificações e preços são obtidos em tempo real do nosso Banco de dados de modelos de IA e mantidos atualizados. Compare qualquer um desses modelos com outros ou estime seu gasto mensal com os calculadores gratuitos acima.