DeepSeek V4-Flash vs. Gemini 3.5 Flash — the two cheapest fast models, compared on real cost. Below is the full side-by-side: specifications, API pricing, context window, local hardware requirements, and a clear, data-driven recommendation on which to pick.

Spezifikation	DeepSeek V4-Flash	Gemini 3.5 Flash
Entwickler	DeepSeek	Google
Typ	LLM (MoE)	LLM (multimodal)
Parameter	284 Mrd. insgesamt / ~13 Mrd. aktiv (MoE)	Nicht bekanntgegeben
Kontextfenster	1 Mio.	1 Mio.
Modalität	Text → Text	Text, Bild, Audio, Video → Text
Lizenz	MIT-Lizenz (offen)	Proprietär
Offene Gewichte	✅ Ja	❌ Nein
Eingabepreis ($/1 Mio.)	$0.14	$1.50
Ausgabepreis ($/1 Mio.)	$0.28	$9.00
VRAM (4-Bit)	~140 GB	—
Mindest-GPU (lokal)	2× H100 mit 80 GB (4-Bit)	—
Veröffentlichung	2026-04	2026

Wesentliche Unterschiede

Kosten: DeepSeek V4-Flash is 1829% cheaper than Gemini 3.5 Flash on a blended-token basis.
Offenheit: DeepSeek V4-Flash is open-weight (self-hostable, private, fine-tunable); Gemini 3.5 Flash is proprietary (API-only, but fully managed).
Run DeepSeek V4-Flash locally: ~~140 GB at 4-bit (min 2× H100 80GB (4-bit)).

Welches Modell sollten Sie wählen?

Choose DeepSeek V4-Flash if you want the lower per-token cost for high-volume workloads, or you want to self-host, fine-tune, or keep data fully private.

Choose Gemini 3.5 Flash if you prefer a fully managed API with no infrastructure to run.

→ Schätzen Sie Ihre tatsächlichen Kosten mit dem API-Kostenrechner · prüfen Sie Ihre lokale Hardware im VRAM-Rechner · durchsuchen Sie alle über 30 Modelle.

Alle Spezifikationen und Preise werden live aus unserer Datenbank für KI-Modelle bezogen und stets aktuell gehalten. Vergleichen Sie eines der beiden Modelle mit anderen Modellen oder schätzen Sie Ihre monatlichen Ausgaben mithilfe der oben genannten kostenlosen Rechner ab.