Llama 4 Scout contre Llama 4 Maverick — Les deux variantes Llama 4 de Meta comparées. Voici ci-dessous une comparaison détaillée : spécifications techniques, tarifs d’API, fenêtre de contexte, exigences matérielles locales, ainsi qu’une recommandation claire, fondée sur les données, quant au modèle à privilégier.

Spécifications	Llama 4 Scout	Llama 4 Maverick
Développeur	Meta	Meta
Type	Multimodal (MoE)	Multimodal (MoE)
Paramètres	109 milliards au total / 17 milliards actifs (MoE)	400 milliards au total / 17 milliards actifs (MoE)
Fenêtre de contexte	10 M	1 million
Modalité	Texte, image → texte	Texte, image → texte
Licence	Llama 4 Community (restreint à l’UE)	Llama 4 Community (restreint à l’UE)
Poids ouverts	✅ Oui	✅ Oui
Prix d'entrée ($/1 million)	$0.1	$0.15
Prix de sortie ($/1 million)	$0.3	$0.6
VRAM (4 bits)	~65 Go	~240 Go
GPU minimal requis (en local)	H100 80 Go / Mac 128 Go	Serveur multi-GPU
Date de sortie	2025	2025

Principales différences

Coût : Llama 4 Scout est 75 % moins cher que Llama 4 Maverick sur une base de coût moyen par jeton.
Contexte : Llama 4 Scout offre une fenêtre de contexte supérieure (10 M contre 1 M), ce qui le rend mieux adapté aux documents longs, aux grands bases de code et aux entrées volumineuses RAG.
Ouverture : les deux modèles ont des poids ouverts, ce qui signifie qu’ils peuvent tous deux être auto-hébergés ou affinés. Comparez leurs besoins en VRAM ci-dessus pour déterminer quel modèle votre GPU peut exécuter.
Exécutez Llama 4 Scout localement : ~65 Go en 4 bits (GPU minimal requis : H100 80 Go / Mac 128 Go).
Exécutez Llama 4 Maverick localement : ~~240 Go en quantification 4 bits (serveur multi-GPU minimal).

Lequel choisir ?

Choisir Llama 4 Scout si vous recherchez un coût inférieur par jeton pour des charges de travail à fort volume, ou si vous avez besoin d’une fenêtre de contexte plus grande.

Choisissez Llama 4 Maverick si celui-ci s’intègre bien à votre pile technologique existante ou si vous préférez Meta.

→ Estimez vos coûts réels avec le Calculateur de coût d’API · vérifiez la compatibilité de votre matériel local avec le Calculateur de VRAM · parcourez l'ensemble des 30+ modèles.

Toutes les spécifications et les prix sont récupérés en temps réel depuis notre Base de données de modèles d'IA et régulièrement mis à jour. Comparez l'un ou l'autre de ces modèles avec d'autres, ou estimez votre dépense mensuelle grâce aux calculateurs gratuits ci-dessus.