DeepSeek V4-Pro vs. DeepSeek V4-Flash — DeepSeek’s flagship versus its budget Flash model. Below is the full side-by-side: specifications, API pricing, context window, local hardware requirements, and a clear, data-driven recommendation on which to pick.
| Especificações | DeepSeek V4-Pro | DeepSeek V4-Flash |
|---|---|---|
| Desenvolvedor | DeepSeek | DeepSeek |
| Tipo | LLM (MoE) | LLM (MoE) |
| Parâmetros | 1,6 trilhão no total / ~49 bilhões ativos (MoE) | 284B no total / ~13B ativos (MoE) |
| Janela de contexto | 1 milhão | 1 milhão |
| Modalidade | Texto → Texto | Texto → Texto |
| Licença | MIT (aberta) | MIT (aberta) |
| Pesos abertos | ✅ Sim | ✅ Sim |
| Preço de entrada (US$ / 1 milhão) | $0.435 | $0.14 |
| Preço de saída (US$ / 1 milhão) | $0.87 | $0.28 |
| VRAM (4 bits) | ~800 GB | ~140 GB |
| GPU mínima (local) | Servidor com múltiplas GPUs (ex.: 8× H100 de 80 GB) | 2× H100 80 GB (4 bits) |
| Lançado | 2026-04 | 2026-04 |
Principais diferenças
- Custo: DeepSeek V4-Flash is 211% cheaper than DeepSeek V4-Pro on a blended-token basis.
- Abertura: ambos possuem pesos abertos, portanto podem ser auto-hospedados ou ajustados. Compare suas necessidades de VRAM acima para saber qual GPU você pode usar.
- Run DeepSeek V4-Pro locally: ~~800 GB at 4-bit (min Multi-GPU server (e.g. 8× H100 80GB)).
- Run DeepSeek V4-Flash locally: ~~140 GB at 4-bit (min 2× H100 80GB (4-bit)).
Qual você deve escolher?
Choose DeepSeek V4-Pro if it fits your existing stack or you prefer DeepSeek.
Choose DeepSeek V4-Flash se você deseja um custo menor por token para cargas de trabalho de alto volume.
→ Estime custos reais no calculador de custos da API · verifique o hardware local no Calculadora de VRAM · navegue por todos os 30+ modelos.
Todas as especificações e preços são obtidos em tempo real do nosso Banco de dados de modelos de IA e mantidos atualizados. Compare qualquer um desses modelos com outros ou estime seu gasto mensal com os calculadores gratuitos acima.
