{"id":1360,"date":"2026-07-03T01:57:38","date_gmt":"2026-07-03T01:57:38","guid":{"rendered":"https:\/\/convly.ai\/?p=1360"},"modified":"2026-07-03T01:57:38","modified_gmt":"2026-07-03T01:57:38","slug":"ollama-models-list-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/","title":{"rendered":"Liste des mod\u00e8les Ollama (2026) : tous les mod\u00e8les populaires, leurs tailles et leurs besoins en m\u00e9moire"},"content":{"rendered":"<p>Si vous ex\u00e9cutez des mod\u00e8les localement, la biblioth\u00e8que Ollama est la source principale de ces mod\u00e8les \u2014 mais elle \u00e9volue constamment et les noms sont souvent obscurs. Voici une liste pratique <strong>des mod\u00e8les Ollama<\/strong> pour 2026 : les mod\u00e8les effectivement utilis\u00e9s, leurs besoins en m\u00e9moire, leurs points forts respectifs, ainsi que les commandes permettant d\u2019afficher les mod\u00e8les d\u00e9j\u00e0 install\u00e9s ou d\u2019en t\u00e9l\u00e9charger de nouveaux. Par d\u00e9faut, Ollama t\u00e9l\u00e9charge une version quantifi\u00e9e en 4 bits, ce qui explique pourquoi un mod\u00e8le \u00ab 70B \u00bb peut tenir sur une station de travail performante, tandis qu\u2019un mod\u00e8le \u00ab 8B \u00bb fonctionne m\u00eame sur un ordinateur portable. Les tailles indiqu\u00e9es ci-dessous correspondent aux versions par d\u00e9faut approximatives \u2014 v\u00e9rifiez toujours la <a href=\"\/fr\/models\/\">Base de donn\u00e9es de mod\u00e8les IA<\/a> ou ex\u00e9cutez la commande <code>ollama list<\/code> pour conna\u00eetre l\u2019\u00e9tat exact des mod\u00e8les disponibles sur votre machine.<\/p>\n<div class=\"convly-tldr\">\n<h3>R\u00e9f\u00e9rence rapide<\/h3>\n<ul>\n<li><strong>Ex\u00e9cution sur n\u2019importe quel ordinateur portable (8\u00a0Go de RAM) :<\/strong> Llama 3.2 3B, Phi-3 Mini, Gemma 3 4B \u2014 l\u00e9gers, rapides et fonctionnant hors ligne.<\/li>\n<li><strong>Meilleur compromis global (16\u00a0Go) :<\/strong> Llama 3.1 8B, Qwen 2.5 7B, Mistral 7B \u2014 le point d\u2019\u00e9quilibre id\u00e9al pour la plupart des utilisateurs.<\/li>\n<li><strong>Haute qualit\u00e9 (32\u00a0Go ou plus \/ GPU) :<\/strong> Gemma 2 27B, Qwen 2.5 32B, Mixtral 8x7B.<\/li>\n<li><strong>Proche de l\u2019\u00e9tat de l\u2019art (poste de travail \/ 48&nbsp;Go ou plus) :<\/strong> Llama 3.3 70B, DeepSeek-R1 70B.<\/li>\n<li><strong>Raisonnement :<\/strong> DeepSeek-R1 est une distillation. <strong>Programmation :<\/strong> Qwen 2.5 Coder, Code Llama. <strong>Vision :<\/strong> LLaVA. <strong>Int\u00e9grations vectorielles (embeddings) :<\/strong> nomic-embed-text.<\/li>\n<li><strong>La r\u00e8gle :<\/strong> choisissez en fonction de la m\u00e9moire dont vous disposez \u2014 v\u00e9rifiez n\u2019importe quel mod\u00e8le avec notre outil gratuit <a href=\"\/fr\/llm-vram-calculator\/\">Calculateur de VRAM<\/a>.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a4777ff8518f\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Basculer<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a4777ff8518f\"  aria-label=\"Basculer\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#The_most_popular_Ollama_models_at_a_glance\" >Les mod\u00e8les Ollama les plus populaires en un coup d\u2019\u0153il<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#How_to_list_the_Ollama_models_you_have_installed\" >Comment lister les mod\u00e8les Ollama d\u00e9j\u00e0 install\u00e9s<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#How_to_find_and_pull_new_models_from_the_library\" >Comment rechercher et t\u00e9l\u00e9charger de nouveaux mod\u00e8les depuis la biblioth\u00e8que<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Small_models_%E2%80%94_run_on_almost_any_laptop\" >Mod\u00e8les l\u00e9gers \u2014 fonctionnent sur presque n\u2019importe quel ordinateur portable<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Mid-size_models_%E2%80%94_the_16_GB_sweet_spot\" >Mod\u00e8les de taille moyenne \u2014 le point id\u00e9al autour de 16&nbsp;Go<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Large_models_%E2%80%94_workstation_and_GPU_territory\" >Mod\u00e8les volumineux \u2014 r\u00e9serv\u00e9s aux postes de travail et aux GPU<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Specialised_models_coding_vision_and_embeddings\" >Mod\u00e8les sp\u00e9cialis\u00e9s : programmation, vision par ordinateur et plongements (embeddings)<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Which_Ollama_model_should_you_actually_use\" >Quel mod\u00e8le Ollama devriez-vous r\u00e9ellement utiliser ?<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Check_a_model_fits_before_you_download\" >V\u00e9rifiez la compatibilit\u00e9 d\u2019un mod\u00e8le avant de le t\u00e9l\u00e9charger<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#Frequently_asked_questions\" >Questions fr\u00e9quemment pos\u00e9es<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/convly.ai\/fr\/ollama-models-list-2026\/#The_bottom_line\" >En r\u00e9sum\u00e9<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_most_popular_Ollama_models_at_a_glance\"><\/span>Les mod\u00e8les Ollama les plus populaires en un coup d\u2019\u0153il<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Chaque mod\u00e8le ci-dessous est disponible via une simple commande <code>ollama pull &lt;nom&gt;<\/code>. \u00ab T\u00e9l\u00e9chargement \u00bb indique la taille approximative par d\u00e9faut en quantification 4 bits (Q4) ; \u00ab M\u00e9moire minimale \u00bb correspond \u00e0 la quantit\u00e9 minimale pratique de RAM syst\u00e8me (CPU) ou de VRAM (GPU) requise pour ex\u00e9cuter le mod\u00e8le confortablement. Les nombres de param\u00e8tres sont exacts ; les tailles sont approximatives et peuvent varier d\u2019une version \u00e0 l\u2019autre.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Mod\u00e8le<\/th>\n<th>Param\u00e8tres<\/th>\n<th>T\u00e9l\u00e9chargement (Q4)<\/th>\n<th>M\u00e9moire minimale<\/th>\n<th>Id\u00e9al pour<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Llama 3.2<\/td>\n<td>1&nbsp;milliard \/ 3&nbsp;milliards<\/td>\n<td>~1,3&nbsp;\/&nbsp;2&nbsp;Go<\/td>\n<td>4\u20138&nbsp;Go<\/td>\n<td>Appareils embarqu\u00e9s, smartphones, chat ultra-l\u00e9ger<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.1<\/td>\n<td>8B<\/td>\n<td>~4,7&nbsp;Go<\/td>\n<td>8\u201316&nbsp;Go<\/td>\n<td>Meilleur mod\u00e8le l\u00e9ger polyvalent<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.3<\/td>\n<td>70B<\/td>\n<td>environ 43\u00a0Go<\/td>\n<td>48&nbsp;Go ou plus<\/td>\n<td>Mod\u00e8le ouvert proche de l\u2019\u00e9tat de l\u2019art<\/td>\n<\/tr>\n<tr>\n<td>Gemma 3<\/td>\n<td>1&nbsp;milliard \/ 4&nbsp;milliards<\/td>\n<td>~0,8&nbsp;\/&nbsp;3,3&nbsp;Go<\/td>\n<td>4\u20138&nbsp;Go<\/td>\n<td>Mod\u00e8le l\u00e9ger efficace (Google)<\/td>\n<\/tr>\n<tr>\n<td>Gemma 2<\/td>\n<td>9&nbsp;milliards \/ 27&nbsp;milliards<\/td>\n<td>~5,4&nbsp;\/&nbsp;16&nbsp;Go<\/td>\n<td>12\u201332&nbsp;Go<\/td>\n<td>Excellente qualit\u00e9 rapport\u00e9e \u00e0 la taille<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5<\/td>\n<td>0,5\u201372&nbsp;milliards<\/td>\n<td>~0,4\u201347&nbsp;Go<\/td>\n<td>4&nbsp;Go ou plus<\/td>\n<td>Multilingue, large \u00e9ventail de tailles<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5 Coder<\/td>\n<td>1,5\u201332&nbsp;milliards<\/td>\n<td>~1\u201320&nbsp;Go<\/td>\n<td>8\u00a0Go ou plus<\/td>\n<td>Assistant local de programmation<\/td>\n<\/tr>\n<tr>\n<td>Mistral<\/td>\n<td>7B<\/td>\n<td>~4,1&nbsp;Go<\/td>\n<td>8&nbsp;Go<\/td>\n<td>Classique rapide et fiable<\/td>\n<\/tr>\n<tr>\n<td>Mistral Nemo<\/td>\n<td>12B<\/td>\n<td>~7&nbsp;Go<\/td>\n<td>16&nbsp;Go<\/td>\n<td>Contexte long de 128 k tokens<\/td>\n<\/tr>\n<tr>\n<td>Mixtral<\/td>\n<td>8\u00d77B<\/td>\n<td>~26&nbsp;Go<\/td>\n<td>32&nbsp;Go et plus<\/td>\n<td>Qualit\u00e9 \u00ab mixture-of-experts \u00bb<\/td>\n<\/tr>\n<tr>\n<td>Phi-4<\/td>\n<td>14B<\/td>\n<td>environ 9\u00a0Go<\/td>\n<td>16&nbsp;Go<\/td>\n<td>Raisonnement dans un petit mod\u00e8le<\/td>\n<\/tr>\n<tr>\n<td>Phi-3 Mini<\/td>\n<td>3,8 milliards de param\u00e8tres<\/td>\n<td>~2,3&nbsp;Go<\/td>\n<td>8&nbsp;Go<\/td>\n<td>Mini mais performant<\/td>\n<\/tr>\n<tr>\n<td>DeepSeek-R1 (distill\u00e9e)<\/td>\n<td>1,5 \u00e0 70 milliards de param\u00e8tres<\/td>\n<td>~1,1 \u00e0 43&nbsp;Go<\/td>\n<td>8\u00a0Go ou plus<\/td>\n<td>Raisonnement \u00e9tape par \u00e9tape<\/td>\n<\/tr>\n<tr>\n<td>LLaVA<\/td>\n<td>7 \u00e0 34 milliards de param\u00e8tres<\/td>\n<td>~4,7 \u00e0 20&nbsp;Go<\/td>\n<td>8\u00a0Go ou plus<\/td>\n<td>Vision (compr\u00e9hension d\u2019images)<\/td>\n<\/tr>\n<tr>\n<td>nomic-embed-text<\/td>\n<td>\u2014<\/td>\n<td>~0,3&nbsp;Go<\/td>\n<td>2&nbsp;Go<\/td>\n<td>Int\u00e9grations (embeddings) pour la recherche et les syst\u00e8mes RAG<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Souhaitez-vous comparer ces mod\u00e8les locaux avec les mod\u00e8les cloud \u00e9quivalents en termes de co\u00fbt et de vitesse ? Le <a href=\"\/fr\/models\/\">Base de donn\u00e9es de mod\u00e8les IA<\/a> r\u00e9pertorie les mod\u00e8les ouverts et ferm\u00e9s c\u00f4te \u00e0 c\u00f4te, tandis que le <a href=\"\/fr\/ai-api-cost-calculator\/\">Calculateur de co\u00fbts des API IA<\/a> montre quand l\u2019ex\u00e9cution locale est plus avantageuse que le paiement \u00e0 l\u2019usage (par jeton).<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_list_the_Ollama_models_you_have_installed\"><\/span>Comment lister les mod\u00e8les Ollama d\u00e9j\u00e0 install\u00e9s<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Pour afficher la liste de tous les mod\u00e8les d\u00e9j\u00e0 pr\u00e9sents sur votre machine, avec leur taille et la date de leur derni\u00e8re utilisation, ex\u00e9cutez la commande suivante :<\/p>\n<p><code>ollama list<\/code><\/p>\n<p>Cette commande affiche le nom, l\u2019\u00e9tiquette (tag), l\u2019identifiant unique et la taille de chaque mod\u00e8le. Pour voir quels mod\u00e8les sont actuellement charg\u00e9s en m\u00e9moire, utilisez la commande <code>ollama ps<\/code>; pour supprimer un mod\u00e8le dont vous n\u2019avez plus besoin et lib\u00e9rer de l\u2019espace disque, utilisez la commande <code>ollama rm &lt;nom&gt;<\/code>. Ces trois commandes \u2014 <code>list<\/code>, <code>ps<\/code> et <code>rm<\/code> \u2014 constituent l\u2019ensemble minimal n\u00e9cessaire pour g\u00e9rer une collection de mod\u00e8les locaux.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_find_and_pull_new_models_from_the_library\"><\/span>Comment rechercher et t\u00e9l\u00e9charger de nouveaux mod\u00e8les depuis la biblioth\u00e8que<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Le catalogue complet d\u2019Ollama est h\u00e9berg\u00e9 dans sa biblioth\u00e8que en ligne, et le t\u00e9l\u00e9chargement de n\u2019importe quel mod\u00e8le ne n\u00e9cessite qu\u2019une seule commande :<\/p>\n<p><code>ollama pull llama3.1<\/code> &nbsp;ou lancez-le directement avec la commande&nbsp; <code>ollama run llama3.1<\/code><\/p>\n<p>Les noms des mod\u00e8les utilisent des \u00e9tiquettes (tags) indiquant leur taille et leur variante \u2014 par exemple : <code>llama3.1:8b<\/code>, <code>gemma2:27b<\/code>, <code>qwen2.5:14b<\/code>. Si vous omettez l\u2019\u00e9tiquette, Ollama t\u00e9l\u00e9charge automatiquement une version par d\u00e9faut raisonnable (g\u00e9n\u00e9ralement la taille la plus populaire quantifi\u00e9e en 4 bits). Pour une premi\u00e8re installation, notre <a href=\"\/fr\/how-to-install-ollama-2026\/\">guide d\u2019installation pas \u00e0 pas d\u2019Ollama<\/a> couvre macOS, Windows et Linux.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Small_models_%E2%80%94_run_on_almost_any_laptop\"><\/span>Mod\u00e8les l\u00e9gers \u2014 fonctionnent sur presque n\u2019importe quel ordinateur portable<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Les mod\u00e8les allant de 1 \u00e0 environ 4 milliards de param\u00e8tres s\u2019ex\u00e9cutent sans probl\u00e8me sur un ordinateur portable moderne \u00e9quip\u00e9 de 8&nbsp;Go de RAM, sans carte graphique requise. <strong>Llama 3.2 3B<\/strong>, <strong>Gemma 3 4B<\/strong> et <strong>Phi-3 Mini<\/strong> sont les mod\u00e8les les plus remarquables : rapides, r\u00e9ellement utiles pour r\u00e9sumer des textes, r\u00e9diger des brouillons ou r\u00e9pondre \u00e0 des questions simples, et suffisamment l\u00e9gers pour rester charg\u00e9s en permanence. Ils ne rivalisent pas avec les mod\u00e8les cloud les plus avanc\u00e9s, mais ils excellent pour des t\u00e2ches quotidiennes priv\u00e9es et hors ligne, et constituent le point de d\u00e9part id\u00e9al pour les d\u00e9butants en IA locale.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Mid-size_models_%E2%80%94_the_16_GB_sweet_spot\"><\/span>Mod\u00e8les de taille moyenne \u2014 le point id\u00e9al autour de 16&nbsp;Go<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La classe des mod\u00e8les de 7 \u00e0 14 milliards de param\u00e8tres convient \u00e0 la plupart des utilisateurs. <strong>Llama 3.1 8B<\/strong>, <strong>Qwen 2.5 7B<\/strong> et <strong>Mistral 7B<\/strong> offrent une am\u00e9lioration notable de la coh\u00e9rence par rapport aux petits mod\u00e8les, tout en s\u2019adaptant ais\u00e9ment \u00e0 16&nbsp;Go de RAM ou \u00e0 une carte graphique grand public. <strong>Phi-4<\/strong> et <strong>Mistral Nemo<\/strong> poussent davantage la qualit\u00e9 et la longueur du contexte. Si vous ne souhaitez utiliser qu\u2019un seul mod\u00e8le pour des usages g\u00e9n\u00e9raux, choisissez-en un dans cette cat\u00e9gorie : il offre le meilleur compromis entre performances et exigences mat\u00e9rielles.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Large_models_%E2%80%94_workstation_and_GPU_territory\"><\/span>Mod\u00e8les volumineux \u2014 r\u00e9serv\u00e9s aux postes de travail et aux GPU<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>\u00c0 partir de 27 milliards de param\u00e8tres, vous entrez dans le domaine du mat\u00e9riel haut de gamme. <strong>Gemma 2 27B<\/strong> et <strong>Qwen 2.5 32B<\/strong> n\u00e9cessite 32&nbsp;Go de m\u00e9moire ou plus ; <strong>Mixtral 8\u00d77B<\/strong> et les mod\u00e8les de la classe 70B \u2014 <strong>Llama 3.3 70B<\/strong> et le <strong>DeepSeek-R1 70B<\/strong> (version distill\u00e9e) \u2014 exigent 48&nbsp;Go ou plus de m\u00e9moire rapide, ce qui signifie concr\u00e8tement une carte graphique haute VRAM ou un Mac dot\u00e9 de puces Apple Silicon tr\u00e8s bien dot\u00e9 en m\u00e9moire. En contrepartie, vous obtenez une qualit\u00e9 proche de celle des grands mod\u00e8les cloud, enti\u00e8rement ex\u00e9cut\u00e9e sur votre propre machine. Consultez notre <a href=\"\/fr\/best-gpus-for-ai-2026\/\">meilleures GPU pour l\u2019IA<\/a> guide d\u00e9taill\u00e9 sur les configurations mat\u00e9rielles capables de faire tourner ces mod\u00e8les.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Specialised_models_coding_vision_and_embeddings\"><\/span>Mod\u00e8les sp\u00e9cialis\u00e9s : programmation, vision par ordinateur et plongements (embeddings)<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Au-del\u00e0 des conversations g\u00e9n\u00e9rales, Ollama propose \u00e9galement des mod\u00e8les sp\u00e9cialis\u00e9s pour des t\u00e2ches pr\u00e9cises. <strong>Qwen 2.5 Coder<\/strong> et <strong>Code Llama<\/strong> est con\u00e7u sp\u00e9cifiquement pour la programmation et s\u2019int\u00e8gre parfaitement avec les outils locaux d\u2019environnements de d\u00e9veloppement int\u00e9gr\u00e9s (IDE). <strong>LLaVA<\/strong> ajoute la vision, permettant ainsi \u00e0 un mod\u00e8le de d\u00e9crire ou de raisonner sur des images. Et les mod\u00e8les d\u2019incorporation (embedding) comme <strong>nomic-embed-text<\/strong> et <strong>mxbai-embed-large<\/strong> ne dialoguent pas du tout \u2014 ils transforment le texte en vecteurs destin\u00e9s \u00e0 la recherche et \u00e0 la g\u00e9n\u00e9ration augment\u00e9e par r\u00e9cup\u00e9ration (RAG), fondement d\u2019une configuration RAG locale.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Which_Ollama_model_should_you_actually_use\"><\/span>Quel mod\u00e8le Ollama devriez-vous r\u00e9ellement utiliser ?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La r\u00e9ponse honn\u00eate est la suivante : le plus grand mod\u00e8le que votre m\u00e9moire peut charger dans la cat\u00e9gorie dont vous avez besoin. Pour une utilisation g\u00e9n\u00e9rale, commencez avec un mod\u00e8le de 8 milliards de param\u00e8tres (8B) et passez \u00e0 des mod\u00e8les plus volumineux uniquement si la qualit\u00e9 ne r\u00e9pond pas \u00e0 vos attentes. Pour le raisonnement, essayez une version distill\u00e9e de DeepSeek-R1 ; pour la programmation, Qwen 2.5 Coder ; pour les images, LLaVA. Nous classons les meilleurs choix par cas d\u2019usage dans <a href=\"\/fr\/best-local-llms-to-run-on-ollama-2026\/\">les meilleurs mod\u00e8les de LLM locaux \u00e0 ex\u00e9cuter sur Ollama<\/a>, et comparons Ollama lui-m\u00eame aux alternatives dans <a href=\"\/fr\/ollama-vs-lm-studio-vs-vllm-vs-llama-cpp-2026\/\">Ollama vs LM Studio vs vLLM vs llama.cpp<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Check_a_model_fits_before_you_download\"><\/span>V\u00e9rifiez la compatibilit\u00e9 d\u2019un mod\u00e8le avant de le t\u00e9l\u00e9charger<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>L\u2019erreur la plus fr\u00e9quente consiste \u00e0 t\u00e9l\u00e9charger un mod\u00e8le trop volumineux pour votre machine \u2014 celui-ci refusera soit de se charger, soit ralentira consid\u00e9rablement en recourant au stockage secondaire (swap). Avant tout t\u00e9l\u00e9chargement, \u00e9valuez sa taille : en r\u00e8gle g\u00e9n\u00e9rale approximative, un mod\u00e8le quantifi\u00e9 en 4 bits n\u00e9cessite un peu moins de 1 Go de m\u00e9moire par milliard de param\u00e8tres, auxquels s\u2019ajoute une marge pour le contexte. Notre outil gratuit <a href=\"\/fr\/llm-vram-calculator\/\">Calculateur de VRAM<\/a> indique pr\u00e9cis\u00e9ment la consommation m\u00e9moire pour n\u2019importe quel mod\u00e8le et toute m\u00e9thode de quantification, tandis que <a href=\"\/fr\/ollama-system-requirements-2026\/\">Exigences syst\u00e8me d\u2019Ollama<\/a> expliquent en d\u00e9tail le compromis entre m\u00e9moire vive (RAM) et m\u00e9moire vid\u00e9o (VRAM).<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Frequently_asked_questions\"><\/span>Questions fr\u00e9quemment pos\u00e9es<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>Comment lister les mod\u00e8les install\u00e9s dans Ollama ?<\/strong> Ex\u00e9cuter <code>ollama list<\/code> permet d\u2019afficher tous les mod\u00e8les install\u00e9s avec leur taille respective, <code>ollama ps<\/code> affiche uniquement celui actuellement charg\u00e9 en m\u00e9moire, et <code>ollama rm &lt;nom&gt;<\/code> permet de supprimer un mod\u00e8le.<\/p>\n<p><strong>Quel est le meilleur mod\u00e8le Ollama ?<\/strong> Il n\u2019existe pas de \u00ab meilleur \u00bb mod\u00e8le universel \u2014 cela d\u00e9pend enti\u00e8rement de la capacit\u00e9 m\u00e9moire de votre machine. Llama 3.1 8B constitue le meilleur choix polyvalent pour les machines \u00e9quip\u00e9es de 16 Go de RAM ; consultez <a href=\"\/fr\/best-local-llms-to-run-on-ollama-2026\/\">notre liste class\u00e9e<\/a> pour identifier le mod\u00e8le optimal selon chaque cas d\u2019usage.<\/p>\n<p><strong>Combien de mod\u00e8les Ollama propose-t-il ?<\/strong> Des centaines, r\u00e9partis entre familles de mod\u00e8les conversationnels, de programmation, de vision et d\u2019incorporation (embedding), chacune offrant plusieurs tailles. Le tableau ci-dessus couvre ceux que la plupart des utilisateurs ex\u00e9cutent effectivement.<\/p>\n<p><strong>De combien de m\u00e9moire vive (RAM) ai-je besoin pour ex\u00e9cuter des mod\u00e8les Ollama ?<\/strong> 8 Go suffisent pour les mod\u00e8les l\u00e9gers (1B\u20134B), 16 Go permettent d\u2019ex\u00e9cuter commod\u00e9ment les mod\u00e8les populaires de 7B \u00e0 8B, tandis qu\u2019au moins 32 Go de RAM ou une carte graphique sont requis pour les mod\u00e8les de 27B et plus. V\u00e9rifiez la consommation m\u00e9moire de tout mod\u00e8le \u00e0 l\u2019aide de notre <a href=\"\/fr\/llm-vram-calculator\/\">Calculateur de VRAM<\/a>.<\/p>\n<p><strong>Puis-je ex\u00e9cuter ces mod\u00e8les hors ligne ?<\/strong> Oui \u2014 une fois t\u00e9l\u00e9charg\u00e9s, tous les mod\u00e8les Ollama s\u2019ex\u00e9cutent enti\u00e8rement sur votre machine, sans aucune connexion Internet. C\u2019est d\u2019ailleurs la raison principale d\u2019utiliser des mod\u00e8les locaux.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_bottom_line\"><\/span>En r\u00e9sum\u00e9<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La liste des mod\u00e8les Ollama est longue, mais le choix est simple : d\u00e9terminez d\u2019abord votre besoin \u2014 discussion g\u00e9n\u00e9rale, raisonnement, programmation, vision ou incorporation \u2014 puis s\u00e9lectionnez le mod\u00e8le le plus volumineux de cette cat\u00e9gorie que votre m\u00e9moire peut accueillir. Commencez petit avec un mod\u00e8le de 8B, utilisez <code>ollama list<\/code> pour suivre vos mod\u00e8les install\u00e9s, et consultez syst\u00e9matiquement le <a href=\"\/fr\/llm-vram-calculator\/\">Calculateur de VRAM<\/a> avant chaque t\u00e9l\u00e9chargement afin d\u2019\u00e9viter d\u2019installer un mod\u00e8le incompatible avec votre machine. \u00c0 partir de l\u00e0, ex\u00e9cuter une IA performante, locale et priv\u00e9e ne demande que quelques commandes.<\/p>\n<p><em>Les noms, tailles et disponibilit\u00e9s des mod\u00e8les \u00e9voluent fr\u00e9quemment ; les chiffres indiqu\u00e9s correspondent \u00e0 des valeurs par d\u00e9faut approximatives, valables \u00e0 la mi-2026 \u2014 veuillez les v\u00e9rifier aupr\u00e8s de <code>ollama list<\/code> et de la biblioth\u00e8que officielle avant de vous y fier.<\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>The full Ollama models list for 2026 \u2014 every popular model with parameters, download size and RAM\/VRAM needs, plus how to list and pull models.<\/p>","protected":false},"author":1,"featured_media":1361,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[3],"tags":[421,268,256,259,859,422,649],"class_list":["post-1360","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-llms","tag-deepseek","tag-llama-3","tag-local-llm","tag-ollama","tag-open-source-models","tag-qwen","tag-run-llm-locally"],"_links":{"self":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/1360","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/comments?post=1360"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/1360\/revisions"}],"predecessor-version":[{"id":1362,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/posts\/1360\/revisions\/1362"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/media\/1361"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/media?parent=1360"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/categories?post=1360"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/fr\/wp-json\/wp\/v2\/tags?post=1360"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}