{"id":790,"date":"2026-06-06T01:59:14","date_gmt":"2026-06-06T01:59:14","guid":{"rendered":"https:\/\/convly.ai\/ollama-system-requirements-2026\/"},"modified":"2026-07-03T13:40:10","modified_gmt":"2026-07-03T13:40:10","slug":"ollama-system-requirements-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/","title":{"rendered":"Configuration requise pour Ollama en 2026 : combien de RAM et de VRAM vous faut-il r\u00e9ellement ?"},"content":{"rendered":"<p>La raison la plus fr\u00e9quente pour laquelle un mod\u00e8le ne s\u2019ex\u00e9cute pas sous Ollama n\u2019est pas un bogue, mais le fait que ce mod\u00e8le d\u00e9passe la capacit\u00e9 m\u00e9moire disponible. Ollama lui-m\u00eame est tr\u00e8s l\u00e9ger ; ce sont les mod\u00e8les qui exigent des ressources mat\u00e9rielles. Ce guide fournit les chiffres r\u00e9els de RAM et de VRAM requis pour chaque taille de mod\u00e8le en 2026, ainsi qu\u2019une formule simple pour d\u00e9terminer ce qui convient \u00e0 votre configuration. <em>avant<\/em> de passer dix minutes \u00e0 t\u00e9l\u00e9charger un mod\u00e8le qui ne chargera pas.<\/p>\n<p>Si vous n\u2019avez pas encore install\u00e9 Ollama, commencez par notre <a href=\"https:\/\/convly.ai\/fr\/how-to-install-ollama-2026\/\">Guide d\u2019installation pas \u00e0 pas<\/a>.<\/p>\n<div class=\"convly-tldr\">\n<h3>Points cl\u00e9s<\/h3>\n<ul>\n<li><strong>R\u00e8gle g\u00e9n\u00e9rale :<\/strong> un mod\u00e8le quantifi\u00e9 (Q4) n\u00e9cessite environ <strong>0,6 Go de m\u00e9moire par milliard de param\u00e8tres<\/strong>, plus une marge pour le contexte.<\/li>\n<li><strong>Mod\u00e8les de 2 \u00e0 3 milliards de param\u00e8tres :<\/strong> s\u2019ex\u00e9cutent sur CPU, avec environ 2 \u00e0 4 Go de RAM. Parfaitement adapt\u00e9s \u00e0 un ordinateur portable basique.<\/li>\n<li><strong>Mod\u00e8les de 7 \u00e0 8 milliards de param\u00e8tres :<\/strong> environ 6 \u00e0 8 Go de RAM\/VRAM. Le compromis id\u00e9al pour la plupart des ordinateurs portables.<\/li>\n<li><strong>Mod\u00e8les de 27 \u00e0 34 milliards de param\u00e8tres :<\/strong> environ 20 \u00e0 24 Go de VRAM. N\u00e9cessitent un GPU haut de gamme ou une puce Apple Silicon dot\u00e9e d\u2019une grande quantit\u00e9 de m\u00e9moire unifi\u00e9e.<\/li>\n<li><strong>Mod\u00e8les de 70 milliards de param\u00e8tres et plus :<\/strong> 40 Go ou plus \u2014 un GPU professionnel, une configuration multi-GPU ou une m\u00e9moire unifi\u00e9e de 64 Go ou plus.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a62a622d811e\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Basculer<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a62a622d811e\"  aria-label=\"Basculer\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#Why_memory_is_the_whole_story\" >Pourquoi la m\u00e9moire constitue l\u2019\u00e9l\u00e9ment d\u00e9terminant<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#The_simple_formula\" >La formule simplifi\u00e9e<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#Requirements_by_model_size\" >Exigences selon la taille du mod\u00e8le<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#GPU_vs_CPU_vs_Apple_Silicon\" >GPU vs CPU vs Apple Silicon<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#How_to_make_a_big_model_fit\" >Comment faire tenir un mod\u00e8le volumineux<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#Storage_and_software_prerequisites_people_forget\" >Pr\u00e9requis en mati\u00e8re de stockage et de logiciels souvent oubli\u00e9s<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#FAQ\" >FAQ<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#Bottom_line\" >Conclusion<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/fr\/ollama-system-requirements-2026\/#Related_articles\" >Articles connexes<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Why_memory_is_the_whole_story\"><\/span>Pourquoi la m\u00e9moire constitue l\u2019\u00e9l\u00e9ment d\u00e9terminant<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Pour g\u00e9n\u00e9rer du texte, les poids d\u2019un mod\u00e8le doivent r\u00e9sider dans une m\u00e9moire rapide \u2014 la VRAM de votre GPU, ou la RAM syst\u00e8me si vous l\u2019ex\u00e9cutez sur CPU. Si le mod\u00e8le ne tient pas, deux sc\u00e9narios se pr\u00e9sentent : soit Ollama d\u00e9place une partie des donn\u00e9es vers une m\u00e9moire plus lente (ce qui entra\u00eene un effondrement des performances), soit il refuse de charger le mod\u00e8le avec une erreur \u00ab m\u00e9moire insuffisante \u00bb. Tous les autres facteurs \u2014 vitesse du CPU, disque dur, syst\u00e8me d\u2019exploitation \u2014 importent nettement moins que la disponibilit\u00e9 d\u2019une m\u00e9moire suffisante et adapt\u00e9e.<\/p>\n<p>Deux facteurs d\u00e9terminent ces exigences :<\/p>\n<ol>\n<li><strong>Nombre de param\u00e8tres<\/strong> \u2014 un mod\u00e8le de 7 milliards de param\u00e8tres comporte 7 milliards de poids ; un mod\u00e8le de 70 milliards en compte dix fois plus.<\/li>\n<li><strong>Quantification<\/strong> \u2014 Ollama utilise des poids compress\u00e9s au format GGUF. Une quantification 4 bits (Q4) divise approximativement par deux la consommation m\u00e9moire par rapport \u00e0 une quantification 8 bits, avec une perte de qualit\u00e9 minimale, ce qui explique pourquoi elle constitue le choix par d\u00e9faut privil\u00e9gi\u00e9.<\/li>\n<\/ol>\n<h2><span class=\"ez-toc-section\" id=\"The_simple_formula\"><\/span>La formule simplifi\u00e9e<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Pour un mod\u00e8le quantifi\u00e9 en 4 bits \u2014 celui que Ollama t\u00e9l\u00e9charge par d\u00e9faut \u2014 l\u2019estimation suivante s\u2019applique :<\/p>\n<blockquote>\n<p><strong>M\u00e9moire requise \u2248 (nombre de param\u00e8tres en milliards) \u00d7 0,6 Go + surcharge li\u00e9e au contexte<\/strong><\/p>\n<\/blockquote>\n<p>Ainsi, un mod\u00e8le de 7 milliards de param\u00e8tres n\u00e9cessite environ 4 \u00e0 5 Go, un mod\u00e8le de 13 milliards environ 8 Go, un mod\u00e8le de 27 milliards environ 18 \u00e0 20 Go, et un mod\u00e8le de 70 milliards n\u00e9cessite 40 Go ou plus. Ajoutez une marge suppl\u00e9mentaire pour le cache KV, dont la taille augmente avec la longueur de vos \u00e9changes. Pr\u00e9voyez toujours quelques gigaoctets de marge pour votre syst\u00e8me d\u2019exploitation.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Requirements_by_model_size\"><\/span>Exigences selon la taille du mod\u00e8le<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Taille du mod\u00e8le<\/th>\n<th>M\u00e9moire (Q4)<\/th>\n<th>Compatible avec<\/th>\n<th>Exemples de mod\u00e8les<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>2\u20133 milliards<\/td>\n<td>~2\u20134 Go<\/td>\n<td>CPU \/ n\u2019importe quel ordinateur portable<\/td>\n<td>Gemma2 2B, Phi-4 mini<\/td>\n<\/tr>\n<tr>\n<td>7\u20138B<\/td>\n<td>~6\u20138 Go<\/td>\n<td>GPU d\u2019entr\u00e9e de gamme \/ ordinateur portable 16 Go<\/td>\n<td>DeepSeek-R1 7B, Llama 3.3 8B<\/td>\n<\/tr>\n<tr>\n<td>13\u201314 milliards<\/td>\n<td>~10\u201312 Go<\/td>\n<td>GPU milieu de gamme<\/td>\n<td>Phi-4, Qwen interm\u00e9diaire<\/td>\n<\/tr>\n<tr>\n<td>27\u201334 milliards<\/td>\n<td>~18\u201324 Go<\/td>\n<td>GPU haut de gamme \/ Apple Silicon<\/td>\n<td>Gemma 4 26B, Qwen 3.6 27B<\/td>\n<\/tr>\n<tr>\n<td>70B<\/td>\n<td>~40\u201348 Go<\/td>\n<td>Station de travail \/ multi-GPU<\/td>\n<td>Classe Llama 70B<\/td>\n<\/tr>\n<tr>\n<td>200 milliards+ (MoE)<\/td>\n<td>100 Go+<\/td>\n<td>Serveur \/ m\u00e9moire unifi\u00e9e tr\u00e8s importante<\/td>\n<td>Qwen3 235B-A22B<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Pour une analyse plus d\u00e9taill\u00e9e par mod\u00e8le sp\u00e9cifique, consultez notre guide sur <a href=\"https:\/\/convly.ai\/fr\/vram-requirements-every-major-llm-2026\/\">exigences en VRAM pour chaque grand mod\u00e8le linguistique (LLM)<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"GPU_vs_CPU_vs_Apple_Silicon\"><\/span>GPU vs CPU vs Apple Silicon<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>GPU NVIDIA<\/strong> \u2014 la r\u00e9f\u00e9rence absolue. La VRAM constitue la limite stricte : le mod\u00e8le doit tenir enti\u00e8rement dans la m\u00e9moire de votre carte graphique pour fonctionner rapidement. Une carte de 24 Go (RTX 4090\/5090) ex\u00e9cute ais\u00e9ment des mod\u00e8les allant jusqu\u2019\u00e0 ~27\u201334 milliards de param\u00e8tres.<\/p>\n<p><strong>Uniquement sur CPU<\/strong> \u2014 fonctionne pour les petits mod\u00e8les (2\u20138 milliards), mais beaucoup plus lentement, car la bande passante de la m\u00e9moire syst\u00e8me ne peut pas rivaliser avec celle d\u2019un GPU. Parfaitement adapt\u00e9 aux t\u00e2ches l\u00e9g\u00e8res sur un ordinateur portable d\u00e9pourvu de GPU d\u00e9di\u00e9.<\/p>\n<p><strong>Apple Silicon<\/strong> \u2014 un cas particulier, et un excellent choix. Les Mac utilisent une m\u00e9moire <em>la m\u00e9moire unifi\u00e9e<\/em> partag\u00e9e entre le CPU et le GPU ; ainsi, un Mac dot\u00e9 de 64 Go peut charger des mod\u00e8les qui exigeraient autrement un PC co\u00fbteux \u00e9quip\u00e9 de plusieurs GPU. Depuis l\u2019ajout du backend MLX dans Ollama v0.19 (mars 2026), les performances d\u2019Apple Silicon se sont nettement am\u00e9lior\u00e9es, faisant d\u2019un Mac \u00e0 haute m\u00e9moire l\u2019une des meilleures machines monocarte disponibles pour ex\u00e9cuter localement des LLM. Pour comparer cette solution \u00e0 un GPU d\u00e9di\u00e9, voir <a href=\"https:\/\/convly.ai\/fr\/amd-strix-halo-vs-apple-m4-pro\/\">Strix Halo contre Apple M4 Pro<\/a>.<\/p>\n<p><strong>GPU AMD<\/strong> \u2014 pris en charge via ROCm. Fonctionne bien pour l\u2019inf\u00e9rence en 2026 ; consultez notre <a href=\"https:\/\/convly.ai\/fr\/amd-rocm-vs-nvidia-cuda-2026\/\">Comparaison ROCm \/ CUDA<\/a> pour conna\u00eetre l\u2019\u00e9tat actuel.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_make_a_big_model_fit\"><\/span>Comment faire tenir un mod\u00e8le volumineux<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Si le mod\u00e8le que vous souhaitez utiliser d\u00e9passe l\u00e9g\u00e8rement votre capacit\u00e9 m\u00e9moire, plusieurs solutions s\u2019offrent \u00e0 vous avant d\u2019abandonner :<\/p>\n<ul>\n<li><strong>Utilisez une quantification plus faible<\/strong> \u2014 choisissez plut\u00f4t une variante <code>q4<\/code> ou m\u00eame <code>q3<\/code> au lieu de <code>q8<\/code>. Vous sacrifiez un peu de qualit\u00e9 au profit d\u2019une \u00e9conomie m\u00e9moire substantielle.<\/li>\n<li><strong>Choisissez un mod\u00e8le plus petit<\/strong> \u2014 un mod\u00e8le bien con\u00e7u de 8 milliards de param\u00e8tres surpasse souvent un mod\u00e8le de 27 milliards qui tourne p\u00e9niblement, avec pagination sur disque.<\/li>\n<li><strong>R\u00e9duisez la fen\u00eatre de contexte<\/strong> \u2014 une fen\u00eatre de contexte plus petite consomme moins de m\u00e9moire pour le cache KV.<\/li>\n<li><strong>Fermez les autres applications<\/strong> \u2014 sur une machine \u00e0 CPU ou \u00e0 m\u00e9moire unifi\u00e9e, la m\u00e9moire RAM libre est votre budget.<\/li>\n<\/ul>\n<p>Pour choisir un mod\u00e8le adapt\u00e9 \u00e0 votre mat\u00e9riel, consultez le guide <a href=\"https:\/\/convly.ai\/fr\/best-local-llms-to-run-on-ollama-2026\/\">Meilleurs mod\u00e8les de langage volumineux locaux compatibles avec Ollama<\/a>.<\/p>\n<p><!--ai-enriched--><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Storage_and_software_prerequisites_people_forget\"><\/span>Pr\u00e9requis en mati\u00e8re de stockage et de logiciels souvent oubli\u00e9s<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La m\u00e9moire vive (RAM) et la m\u00e9moire vid\u00e9o (VRAM) attirent toute l\u2019attention, mais deux exigences plus discr\u00e8tes font \u00e9chouer davantage d\u2019installations initiales que tout autre facteur : l\u2019espace disque disponible et la pile logicielle sous-jacente. Si vous ne respectez pas ces conditions, Ollama refuse soit de s\u2019installer, soit \u00e9choue \u00e0 mi-chemin du t\u00e9l\u00e9chargement d\u2019un mod\u00e8le.<\/p>\n<p><strong>Espace disque.<\/strong> Le binaire Ollama lui-m\u00eame est l\u00e9ger \u2014 comptez environ <strong>4&nbsp;Go<\/strong> pour l\u2019installation. Ce sont les mod\u00e8les qui consomment votre espace disque. Chaque mod\u00e8le est t\u00e9l\u00e9charg\u00e9 une seule fois et mis en cache sur le disque, puis charg\u00e9 en m\u00e9moire lors de son ex\u00e9cution ; vous devez donc disposer d\u2019un espace suffisant pour stocker int\u00e9gralement les poids des mod\u00e8les, en sus de l\u2019espace libre d\u00e9j\u00e0 disponible. \u00c0 titre indicatif, pour une quantification courante en 4 bits :<\/p>\n<ul>\n<li><strong>Un mod\u00e8le de 8 milliards de param\u00e8tres (8B)<\/strong> (ex. : Llama 3.1 8B) occupe environ 5&nbsp;Go sur le disque.<\/li>\n<li><strong>Un mod\u00e8le de la classe 20B :<\/strong> environ 12 \u00e0 14&nbsp;Go.<\/li>\n<li><strong>Un mod\u00e8le de 70 milliards de param\u00e8tres (70B) :<\/strong> environ 40&nbsp;Go.<\/li>\n<li><strong>Un tr\u00e8s grand mod\u00e8le MoE<\/strong> (classe Llama&nbsp;4) : 65&nbsp;Go ou plus.<\/li>\n<\/ul>\n<p>Ces volumes s\u2019accumulent rapidement. Une collection occasionnelle de quelques mod\u00e8les atteint facilement 30 \u00e0 80&nbsp;Go ; conserver plusieurs variantes volumineuses vous fera d\u00e9passer sans effort les 200&nbsp;Go. Un SSD de 512&nbsp;Go constitue un seuil raisonnable si vous envisagez de constituer une collection de mod\u00e8les.<\/p>\n<p><strong>Utilisez un SSD, de pr\u00e9f\u00e9rence NVMe.<\/strong> Comme les poids sont lus depuis le disque vers la RAM ou la VRAM \u00e0 chaque premier chargement d\u2019un mod\u00e8le, un disque dur m\u00e9canique lent se traduit directement par un d\u00e9marrage p\u00e9niblement lent \u2014 un mod\u00e8le de 40&nbsp;Go mettrait des minutes \u00e0 charger depuis un disque rotatif. Un stockage rapide n\u2019am\u00e9liore pas le d\u00e9bit de tokens par seconde une fois le mod\u00e8le charg\u00e9, mais il rend la premi\u00e8re requ\u00eate quasi instantan\u00e9e au lieu d\u2019une attente de 30 secondes.<\/p>\n<p><strong>Syst\u00e8me d\u2019exploitation et pilotes.<\/strong> Ollama fonctionne nativement sur les trois plateformes, mais chacune impose un minimum :<\/p>\n<ul>\n<li><strong>macOS :<\/strong> version 11 (Big Sur) ou ult\u00e9rieure, sur processeurs Apple Silicon comme sur Intel.<\/li>\n<li><strong>Windows :<\/strong> Windows 10 version 22H2 ou ult\u00e9rieure (\u00e9ditions Famille ou Professionnel), sur architectures x86_64 et ARM64 \u2014 ainsi, les ordinateurs \u00e9quip\u00e9s de puces Snapdragon l\u2019ex\u00e9cutent nativement, sans \u00e9mulation x86.<\/li>\n<li><strong>Linux :<\/strong> la plupart des distributions r\u00e9centes (Ubuntu 18.04+, Debian, Fedora, RHEL, Arch).<\/li>\n<\/ul>\n<p>Pour l\u2019acc\u00e9l\u00e9ration GPU, vous avez \u00e9galement besoin de pilotes \u00e0 jour : un pilote NVIDIA r\u00e9cent \u2014 <strong>version 531 ou sup\u00e9rieure<\/strong> (et version 570 ou sup\u00e9rieure pour les cartes graphiques anciennes des g\u00e9n\u00e9rations Maxwell et Pascal) \u2014 pour CUDA, ou une pile de pilotes compatible Vulkan ou ROCm v7 pour les cartes AMD Radeon. En cas d\u2019absence ou de d\u00e9su\u00e9tude du pilote, Ollama retombe silencieusement sur le CPU \u2014 ce qui constitue la cause la plus fr\u00e9quente de ralentissement sur une machine \u00ab dot\u00e9e d\u2019un bon GPU \u00bb.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>FAQ<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>De combien de m\u00e9moire RAM ai-je besoin pour ex\u00e9cuter Ollama ?<\/h3>\n<p>Cela d\u00e9pend enti\u00e8rement du mod\u00e8le. Ollama lui-m\u00eame n\u00e9cessite presque rien ; c\u2019est le mod\u00e8le qui fixe la demande. En r\u00e8gle g\u00e9n\u00e9rale, un mod\u00e8le quantifi\u00e9 en 4 bits n\u00e9cessite environ 0,6 Go par milliard de param\u00e8tres \u2014 soit ~4\u20135 Go pour un mod\u00e8le de 7 milliards, ~8 Go pour un mod\u00e8le de 13 milliards, et 40 Go ou plus pour un mod\u00e8le de 70 milliards. Pr\u00e9voyez toujours quelques gigaoctets suppl\u00e9mentaires pour votre syst\u00e8me d\u2019exploitation.<\/p>\n<h3>Puis-je ex\u00e9cuter Ollama sans GPU ?<\/h3>\n<p>Oui. Les petits mod\u00e8les (2\u20138 milliards) fonctionnent correctement sur CPU, bien qu\u2019avec une vitesse inf\u00e9rieure \u00e0 celle d\u2019un GPU. Un mod\u00e8le comme Gemma2 2B n\u00e9cessite seulement environ 1,7 Go de RAM et fonctionne sur des ordinateurs portables basiques. Pour les mod\u00e8les sup\u00e9rieurs \u00e0 ~13 milliards, un GPU ou un Apple Silicon dot\u00e9 de m\u00e9moire unifi\u00e9e fait r\u00e9ellement la diff\u00e9rence.<\/p>\n<h3>De combien de VRAM ai-je besoin pour un mod\u00e8le de 7 milliards ?<\/h3>\n<p>Environ 6\u20138 Go pour un mod\u00e8le de 7 milliards quantifi\u00e9 en 4 bits, y compris une marge pour le contexte. Cela convient parfaitement \u00e0 la plupart des GPU grand public d\u2019entr\u00e9e de gamme, ainsi qu\u2019aux ordinateurs portables disposant de 16 Go de m\u00e9moire unifi\u00e9e ou syst\u00e8me.<\/p>\n<h3>Pourquoi Ollama fonctionne-t-il si lentement ?<\/h3>\n<p>Presque toujours parce que le mod\u00e8le ne tient pas enti\u00e8rement dans la VRAM de votre GPU, ce qui force une partie \u00e0 \u00eatre d\u00e9plac\u00e9e vers la m\u00e9moire syst\u00e8me ou le CPU. V\u00e9rifiez avec <code>ollama ps<\/code> \u2014 si l\u2019utilisation du CPU appara\u00eet \u00e9lev\u00e9e, passez \u00e0 un mod\u00e8le plus petit ou \u00e0 une quantification plus agressive afin que le mod\u00e8le tienne enti\u00e8rement dans la m\u00e9moire rapide.<\/p>\n<h3>Un Mac est-il adapt\u00e9 \u00e0 l\u2019ex\u00e9cution d\u2019Ollama ?<\/h3>\n<p>Oui, souvent excellente. La m\u00e9moire unifi\u00e9e d\u2019Apple Silicon permet \u00e0 un Mac disposant de 64&nbsp;Go de RAM d\u2019ex\u00e9cuter des mod\u00e8les <a href=\"https:\/\/convly.ai\/fr\/llm-vram-calculator\/\"  data-wpil-monitor-id=\"62\">qui exigeraient sinon un PC co\u00fbteux \u00e9quip\u00e9 de plusieurs GPU, et le backend MLX (depuis la version v0.19) en a \u00e9galement fait une solution performante. Un Mac dot\u00e9 d\u2019une grande quantit\u00e9 de m\u00e9moire constitue l\u2019une des meilleures options monocarte pour les LLM locaux en 2026.<\/a> that would otherwise need a costly multi-GPU PC, and the MLX backend (since v0.19) made it fast too. A high-memory Mac is one of the best single-machine options for local LLMs in 2026.<\/p>\n<h3>De combien d\u2019espace disque ai-je besoin pour Ollama ?<\/h3>\n<p>Pr\u00e9voyez environ 4&nbsp;Go pour l\u2019installation d\u2019Ollama elle-m\u00eame, puis ajoutez la taille de chaque mod\u00e8le que vous t\u00e9l\u00e9chargez. En quantification 4 bits, un mod\u00e8le de 8B occupe environ 5&nbsp;Go, un mod\u00e8le de 70B environ 40&nbsp;Go, et les mod\u00e8les les plus volumineux d\u00e9passent les 65&nbsp;Go. Une configuration typique avec plusieurs mod\u00e8les se situe entre 30 et 80&nbsp;Go ; un SSD de 512&nbsp;Go constitue donc un point de d\u00e9part confortable. Un SSD (de pr\u00e9f\u00e9rence NVMe) est fortement recommand\u00e9, car les mod\u00e8les sont charg\u00e9s depuis le disque \u00e0 chaque premi\u00e8re ex\u00e9cution.<\/p>\n<h3>O\u00f9 Ollama stocke-t-il les mod\u00e8les, et puis-je les d\u00e9placer vers un autre disque ?<\/h3>\n<p>Par d\u00e9faut, Ollama conserve les mod\u00e8les t\u00e9l\u00e9charg\u00e9s dans un dossier cach\u00e9 de votre r\u00e9pertoire personnel \u2014 <strong>~\/.ollama<\/strong> sur macOS et Linux, et <strong>%HOMEPATH%.ollama<\/strong> sur Windows. Si votre disque syst\u00e8me est limit\u00e9 en capacit\u00e9, vous pouvez rediriger le stockage vers un disque plus spacieux ou externe en d\u00e9finissant la variable d\u2019environnement <strong>OLLAMA_MODELS<\/strong> avant de lancer Ollama. Il s\u2019agit de la solution la plus propre lorsque votre disque syst\u00e8me manque d\u2019espace.<\/p>\n<h3>Quels syst\u00e8mes d\u2019exploitation Ollama prend-il en charge ?<\/h3>\n<p>Ollama fonctionne nativement sur macOS 11 (Big Sur) ou ult\u00e9rieur, Windows 10 version 22H2 ou ult\u00e9rieure (64 bits, y compris les appareils ARM64 tels que les ordinateurs portables Snapdragon), et la plupart des distributions Linux r\u00e9centes, notamment Ubuntu 18.04+, Fedora et Arch. Pour l\u2019acc\u00e9l\u00e9ration GPU, vous devez \u00e9galement disposer d\u2019un pilote \u00e0 jour \u2014 un pilote NVIDIA r\u00e9cent pour CUDA, ou un pilote compatible ROCm\/Vulkan pour AMD \u2014 sinon Ollama s\u2019ex\u00e9cute sur le CPU.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Conclusion<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Avant tout t\u00e9l\u00e9chargement, effectuez rapidement ce calcul : nombre de param\u00e8tres \u00d7 0,6 Go pour un mod\u00e8le quantifi\u00e9 en 4 bits, plus une marge de s\u00e9curit\u00e9. Comparez ce r\u00e9sultat \u00e0 votre VRAM (NVIDIA\/AMD) ou \u00e0 votre m\u00e9moire unifi\u00e9e (Apple), et vous \u00e9viterez d\u00e9finitivement les erreurs frustrantes de m\u00e9moire insuffisante. En cas de doute, commencez avec un mod\u00e8le une taille en dessous de celui que vous aviez envisag\u00e9 \u2014 un mod\u00e8le qui tient et fonctionne rapidement vaut mieux qu\u2019un mod\u00e8le plus gros qui peine.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Articles connexes<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/fr\/deepseek-v4-flash-vs-gemini-3-5-flash\/\">DeepSeek V4-Flash vs Gemini 3.5 Flash: Specs, Pricing &amp; Which to Choose (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/ollama-vs-jan-2026\/\">Ollama contre Jan : quelle application IA locale l\u2019emporte en 2026 ?<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/lm-studio-complete-guide-2026\/\">LM Studio : Le guide complet (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/claude-5-new-ai-models-june-2026\/\">Existe-t-il un Claude 5 ? Claude Fable 5 et tous les principaux mod\u00e8les d\u2019IA de juin 2026<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/llm-hallucinations-complete-guide\/\">Hallucinations des mod\u00e8les de langage volumineux en 2026 : pourquoi elles surviennent et comment les \u00e9viter<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/prompt-engineering-techniques\/\">Ing\u00e9nierie des prompts en 2026 : 12 techniques r\u00e9ellement efficaces<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/fr\/what-is-ollama-complete-guide-2026\/\">Qu\u2019est-ce qu\u2019Ollama ? Le guide complet pour ex\u00e9cuter des LLM localement en 2026<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>La principale raison pour laquelle un mod\u00e8le ne fonctionne pas n'est pas un bug, mais un probl\u00e8me de m\u00e9moire. Voici les besoins pr\u00e9cis en RAM et en VRAM pour chaque taille de mod\u00e8le Ollama, ainsi qu'une formule \u00e0 conna\u00eetre avant de t\u00e9l\u00e9charger.<\/p>","protected":false},"author":1,"featured_media":796,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[3],"tags":[642,643,640,644,641,639],"class_list":["post-790","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-llms","tag-local-llm-vram","tag-ollama-gpu","tag-ollama-hardware-requirements","tag-ollama-ram","tag-ollama-requirements","tag-ollama-system-requirements"],"_links":{"self":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/790","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/comments?post=790"}],"version-history":[{"count":5,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/790\/revisions"}],"predecessor-version":[{"id":1432,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/790\/revisions\/1432"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/media\/796"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/media?parent=790"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/categories?post=790"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/tags?post=790"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}