{"id":1360,"date":"2026-07-03T01:57:38","date_gmt":"2026-07-03T01:57:38","guid":{"rendered":"https:\/\/convly.ai\/?p=1360"},"modified":"2026-07-03T01:57:38","modified_gmt":"2026-07-03T01:57:38","slug":"ollama-models-list-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/","title":{"rendered":"Lista de modelos do Ollama (2026): todos os modelos populares, tamanhos e requisitos de mem\u00f3ria"},"content":{"rendered":"<p>Se voc\u00ea executa modelos localmente, a biblioteca do Ollama \u00e9 de onde a maioria deles prov\u00e9m \u2014 mas ela muda constantemente e os nomes s\u00e3o cripticos. Este \u00e9 um guia pr\u00e1tico <strong>lista de modelos do Ollama<\/strong> para 2026: os modelos que as pessoas realmente executam, quanto mem\u00f3ria cada um exige, para que cada um \u00e9 indicado, al\u00e9m de como listar os modelos j\u00e1 instalados e baixar novos. Por padr\u00e3o, o Ollama baixa uma vers\u00e3o quantizada em 4 bits, raz\u00e3o pela qual um modelo de \"70B\" pode caber em uma esta\u00e7\u00e3o de trabalho potente e um modelo de \"8B\" roda at\u00e9 mesmo em um laptop. Os tamanhos indicados abaixo s\u00e3o aproxima\u00e7\u00f5es dos valores padr\u00e3o \u2014 verifique sempre o <a href=\"\/pt\/models\/\">Banco de dados de modelos de IA<\/a> ou execute <code>ollama list<\/code> para saber quais modelos est\u00e3o dispon\u00edveis atualmente na sua m\u00e1quina.<\/p>\n<div class=\"convly-tldr\">\n<h3>Refer\u00eancia r\u00e1pida<\/h3>\n<ul>\n<li><strong>Execut\u00e1vel em qualquer laptop (8 GB de RAM):<\/strong> Llama 3.2 3B, Phi-3 Mini, Gemma 3 4B \u2014 pequenos, r\u00e1pidos e funcionam offline.<\/li>\n<li><strong>Melhor desempenho geral (16 GB):<\/strong> Llama 3.1 8B, Qwen 2.5 7B, Mistral 7B \u2014 o ponto ideal para a maioria dos usu\u00e1rios.<\/li>\n<li><strong>Alta qualidade (32 GB ou mais \/ GPU):<\/strong> Gemma 2 27B, Qwen 2.5 32B, Mixtral 8x7B.<\/li>\n<li><strong>Pr\u00f3ximo do estado da arte (esta\u00e7\u00e3o de trabalho \/ 48 GB ou mais):<\/strong> Llama 3.3 70B, DeepSeek-R1 70B.<\/li>\n<li><strong>Racioc\u00ednio:<\/strong> DeepSeek-R1 \u00e9 uma distila\u00e7\u00e3o. <strong>Codifica\u00e7\u00e3o:<\/strong> Qwen 2.5 Coder, Code Llama. <strong>Vis\u00e3o:<\/strong> LLaVA. <strong>Incorpora\u00e7\u00f5es (embeddings):<\/strong> nomic-embed-text.<\/li>\n<li><strong>A regra:<\/strong> escolha com base na mem\u00f3ria dispon\u00edvel \u2014 verifique qualquer modelo com nossa ferramenta gratuita <a href=\"\/pt\/llm-vram-calculator\/\">Calculadora de VRAM<\/a>.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a4777eb25b9b\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Alternar<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a4777eb25b9b\"  aria-label=\"Alternar\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#The_most_popular_Ollama_models_at_a_glance\" >Os modelos Ollama mais populares em um relance<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#How_to_list_the_Ollama_models_you_have_installed\" >Como listar os modelos Ollama j\u00e1 instalados<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#How_to_find_and_pull_new_models_from_the_library\" >Como localizar e baixar novos modelos da biblioteca<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Small_models_%E2%80%94_run_on_almost_any_laptop\" >Modelos pequenos \u2014 executam em quase qualquer laptop<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Mid-size_models_%E2%80%94_the_16_GB_sweet_spot\" >Modelos de tamanho m\u00e9dio \u2014 ponto ideal para 16 GB<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Large_models_%E2%80%94_workstation_and_GPU_territory\" >Modelos grandes \u2014 exigem esta\u00e7\u00f5es de trabalho e GPUs<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Specialised_models_coding_vision_and_embeddings\" >Modelos especializados: codifica\u00e7\u00e3o, vis\u00e3o e incorpora\u00e7\u00f5es (embeddings)<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Which_Ollama_model_should_you_actually_use\" >Qual modelo Ollama voc\u00ea realmente deveria usar?<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Check_a_model_fits_before_you_download\" >Verifique se o modelo cabe no seu sistema antes de baix\u00e1-lo<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#Frequently_asked_questions\" >Perguntas frequentes<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/convly.ai\/pt\/ollama-models-list-2026\/#The_bottom_line\" >Conclus\u00e3o<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_most_popular_Ollama_models_at_a_glance\"><\/span>Os modelos Ollama mais populares em um relance<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Todos os modelos listados abaixo est\u00e3o dispon\u00edveis com um simples comando <code>ollama pull &lt;nome&gt;<\/code>. A coluna \u00abBaixar\u00bb indica aproximadamente o tamanho padr\u00e3o em 4 bits (Q4); \u00abMem\u00f3ria m\u00ednima\u00bb representa o limite pr\u00e1tico de RAM do sistema (CPU) ou VRAM (GPU) necess\u00e1rio para execut\u00e1-lo confortavelmente. As contagens de par\u00e2metros s\u00e3o exatas; os tamanhos s\u00e3o aproximados e podem variar conforme cada nova vers\u00e3o.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Modelo<\/th>\n<th>Par\u00e2metros<\/th>\n<th>Baixar (Q4)<\/th>\n<th>Mem\u00f3ria m\u00ednima<\/th>\n<th>Melhor para<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Llama 3.2<\/td>\n<td>1B \/ 3B<\/td>\n<td>~1,3 \/ 2 GB<\/td>\n<td>4\u20138 GB<\/td>\n<td>Dispositivos de borda, smartphones, conversa\u00e7\u00e3o ultraleve<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.1<\/td>\n<td>8B<\/td>\n<td>~4,7 GB<\/td>\n<td>8\u201316 GB<\/td>\n<td>Melhor modelo pequeno vers\u00e1til<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.3<\/td>\n<td>70B<\/td>\n<td>~43 GB<\/td>\n<td>48 GB ou mais<\/td>\n<td>Modelo aberto pr\u00f3ximo do estado da arte<\/td>\n<\/tr>\n<tr>\n<td>Gemma 3<\/td>\n<td>1B \/ 4B<\/td>\n<td>~0,8 \/ 3,3 GB<\/td>\n<td>4\u20138 GB<\/td>\n<td>Pequeno e eficiente (Google)<\/td>\n<\/tr>\n<tr>\n<td>Gemma 2<\/td>\n<td>9B \/ 27B<\/td>\n<td>~5,4 \/ 16 GB<\/td>\n<td>12\u201332 GB<\/td>\n<td>Excelente rela\u00e7\u00e3o qualidade\/tamanho<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5<\/td>\n<td>0,5B\u201372B<\/td>\n<td>~0,4\u201347 GB<\/td>\n<td>4 GB ou mais<\/td>\n<td>Multil\u00edngue, ampla faixa de tamanhos<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5 Coder<\/td>\n<td>1,5B\u201332B<\/td>\n<td>~1\u201320 GB<\/td>\n<td>8 GB ou mais<\/td>\n<td>Assistente de programa\u00e7\u00e3o local<\/td>\n<\/tr>\n<tr>\n<td>Mistral<\/td>\n<td>7B<\/td>\n<td>~4,1 GB<\/td>\n<td>8 GB<\/td>\n<td>Cl\u00e1ssico r\u00e1pido e confi\u00e1vel<\/td>\n<\/tr>\n<tr>\n<td>Mistral Nemo<\/td>\n<td>12B<\/td>\n<td>~7 GB<\/td>\n<td>16 GB<\/td>\n<td>Contexto longo de 128k<\/td>\n<\/tr>\n<tr>\n<td>Mixtral<\/td>\n<td>8\u00d77B<\/td>\n<td>~26&nbsp;GB<\/td>\n<td>32&nbsp;GB ou mais<\/td>\n<td>Qualidade de mistura de especialistas (mixture-of-experts)<\/td>\n<\/tr>\n<tr>\n<td>Phi-4<\/td>\n<td>14B<\/td>\n<td>~9 GB<\/td>\n<td>16 GB<\/td>\n<td>Racioc\u00ednio em um modelo pequeno<\/td>\n<\/tr>\n<tr>\n<td>Phi-3 Mini<\/td>\n<td>3,8B<\/td>\n<td>~2,3&nbsp;GB<\/td>\n<td>8 GB<\/td>\n<td>Pequeno, mas capaz<\/td>\n<\/tr>\n<tr>\n<td>DeepSeek-R1 (vers\u00e3o destilada)<\/td>\n<td>1,5B\u201370B<\/td>\n<td>~1,1\u201343&nbsp;GB<\/td>\n<td>8 GB ou mais<\/td>\n<td>Racioc\u00ednio passo a passo<\/td>\n<\/tr>\n<tr>\n<td>LLaVA<\/td>\n<td>7B\u201334B<\/td>\n<td>~4,7\u201320&nbsp;GB<\/td>\n<td>8 GB ou mais<\/td>\n<td>Vis\u00e3o (compreens\u00e3o de imagens)<\/td>\n<\/tr>\n<tr>\n<td>nomic-embed-text<\/td>\n<td>\u2014<\/td>\n<td>~0,3&nbsp;GB<\/td>\n<td>2&nbsp;GB<\/td>\n<td>Incorpora\u00e7\u00f5es (embeddings) para RAG\/pesquisa<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Quer comparar esses modelos locais com os modelos em nuvem quanto a pre\u00e7o e velocidade? A <a href=\"\/pt\/models\/\">Banco de dados de modelos de IA<\/a> lista modelos abertos e fechados lado a lado, e o <a href=\"\/pt\/ai-api-cost-calculator\/\">Calculadora de custos de API de IA<\/a> mostra quando executar localmente \u00e9 mais vantajoso do que pagar por token.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_list_the_Ollama_models_you_have_installed\"><\/span>Como listar os modelos Ollama j\u00e1 instalados<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Para ver todos os modelos j\u00e1 instalados em sua m\u00e1quina, com seus tamanhos e datas da \u00faltima utiliza\u00e7\u00e3o, execute:<\/p>\n<p><code>ollama list<\/code><\/p>\n<p>Isso exibe o nome, a tag, o ID exclusivo e o tamanho de cada modelo. Para ver quais modelos est\u00e3o atualmente carregados na mem\u00f3ria, use <code>ollama ps<\/code>; para remover um modelo que voc\u00ea n\u00e3o precisa mais e recuperar espa\u00e7o em disco, use <code>ollama rm &lt;nome&gt;<\/code>. Esses tr\u00eas comandos \u2014 <code>list<\/code>, <code>ps<\/code> e <code>rm<\/code> \u2014 s\u00e3o tudo de que voc\u00ea precisa para gerenciar uma cole\u00e7\u00e3o local de modelos.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_find_and_pull_new_models_from_the_library\"><\/span>Como localizar e baixar novos modelos da biblioteca<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>O cat\u00e1logo completo do Ollama est\u00e1 dispon\u00edvel na sua biblioteca online, e baixar qualquer modelo exige apenas um comando:<\/p>\n<p><code>ollama pull llama3.1<\/code> &nbsp;ou execute-o diretamente com&nbsp; <code>ollama run llama3.1<\/code><\/p>\n<p>Os nomes dos modelos usam tags para indicar tamanho e variante \u2014 por exemplo, <code>llama3.1:8b<\/code>, <code>gemma2:27b<\/code>, <code>qwen2.5:14b<\/code>. Se voc\u00ea omitir a tag, o Ollama baixa uma vers\u00e3o padr\u00e3o razo\u00e1vel (geralmente o tamanho mais popular em 4 bits). Para uma primeira instala\u00e7\u00e3o, nosso <a href=\"\/pt\/how-to-install-ollama-2026\/\">guia passo a passo de instala\u00e7\u00e3o do Ollama<\/a> abrange Mac, Windows e Linux.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Small_models_%E2%80%94_run_on_almost_any_laptop\"><\/span>Modelos pequenos \u2014 executam em quase qualquer laptop<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Modelos com 1B a cerca de 4B de par\u00e2metros funcionam bem em um laptop moderno com 8&nbsp;GB de RAM, sem necessidade de GPU. <strong>Llama 3.2 3B<\/strong>, <strong>Gemma 3 4B<\/strong> e <strong>Phi-3 Mini<\/strong> s\u00e3o destaques: r\u00e1pidos, realmente \u00fateis para resumos, reda\u00e7\u00e3o de textos e respostas a perguntas simples, e pequenos o suficiente para permanecer carregados na mem\u00f3ria. Eles n\u00e3o igualam modelos avan\u00e7ados em nuvem, mas s\u00e3o excelentes para tarefas cotidianas privadas e offline \u2014 e constituem o ponto de partida ideal se voc\u00ea \u00e9 novo em IA local.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Mid-size_models_%E2%80%94_the_16_GB_sweet_spot\"><\/span>Modelos de tamanho m\u00e9dio \u2014 ponto ideal para 16 GB<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>A classe de 7B a 14B \u00e9 onde a maioria das pessoas deve concentrar-se. <strong>Llama 3.1 8B<\/strong>, <strong>Qwen 2.5 7B<\/strong> e <strong>Mistral 7B<\/strong> oferecem um grande salto em coer\u00eancia em compara\u00e7\u00e3o com os modelos menores, mantendo-se confortavelmente dentro de 16&nbsp;GB de RAM ou em uma GPU convencional. <strong>Phi-4<\/strong> e <strong>Mistral Nemo<\/strong> impulsionam ainda mais qualidade e comprimento de contexto. Se voc\u00ea deseja um \u00fanico modelo para uso geral, escolha um dessa faixa \u2014 ele representa o melhor equil\u00edbrio entre capacidade e exig\u00eancias de hardware.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Large_models_%E2%80%94_workstation_and_GPU_territory\"><\/span>Modelos grandes \u2014 exigem esta\u00e7\u00f5es de trabalho e GPUs<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>A partir de 27B, voc\u00ea entra no dom\u00ednio de hardware robusto. <strong>Gemma 2 27B<\/strong> e <strong>Qwen 2.5 32B<\/strong> exige 32&nbsp;GB ou mais; <strong>Mixtral 8x7B<\/strong> e os modelos da classe 70B \u2014 <strong>Llama 3.3 70B<\/strong> e o <strong>DeepSeek-R1 70B<\/strong> (vers\u00e3o destilada) \u2014 exigem 48&nbsp;GB ou mais de mem\u00f3ria r\u00e1pida, o que, na pr\u00e1tica, significa uma GPU com alta VRAM ou um Mac com Apple Silicon de alta mem\u00f3ria. A recompensa \u00e9 uma qualidade que se aproxima da dos grandes modelos em nuvem, executados integralmente em sua pr\u00f3pria m\u00e1quina. Consulte nosso <a href=\"\/pt\/best-gpus-for-ai-2026\/\">melhores GPUs para IA<\/a> guia sobre quais hardwares realmente suportam esses modelos.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Specialised_models_coding_vision_and_embeddings\"><\/span>Modelos especializados: codifica\u00e7\u00e3o, vis\u00e3o e incorpora\u00e7\u00f5es (embeddings)<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Al\u00e9m de conversa\u00e7\u00e3o geral, o Ollama hospeda modelos especializados em tarefas espec\u00edficas. <strong>Qwen 2.5 Coder<\/strong> e <strong>Code Llama<\/strong> foi desenvolvido especificamente para programa\u00e7\u00e3o e integra-se bem com ferramentas locais de IDE. <strong>LLaVA<\/strong> adiciona vis\u00e3o, permitindo que um modelo descreva ou raciocine sobre imagens. E modelos de incorpora\u00e7\u00e3o (embedding) como <strong>nomic-embed-text<\/strong> e <strong>mxbai-embed-large<\/strong> n\u00e3o realizam conversas de forma alguma \u2014 eles convertem texto em vetores para busca e gera\u00e7\u00e3o aumentada por recupera\u00e7\u00e3o (retrieval-augmented generation), a espinha dorsal de uma configura\u00e7\u00e3o local RAG.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Which_Ollama_model_should_you_actually_use\"><\/span>Qual modelo Ollama voc\u00ea realmente deveria usar?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>A resposta honesta \u00e9: o maior modelo que sua mem\u00f3ria conseguir carregar na classe de que voc\u00ea precisa. Para uso geral, comece com um modelo de 8B e suba apenas se a qualidade for insuficiente. Para racioc\u00ednio, experimente uma vers\u00e3o distilada do DeepSeek-R1; para programa\u00e7\u00e3o, o Qwen 2.5 Coder; para imagens, o LLaVA. Classificamos as melhores op\u00e7\u00f5es por caso de uso em <a href=\"\/pt\/best-local-llms-to-run-on-ollama-2026\/\">os melhores LLMs locais para executar no Ollama<\/a>, e comparamos o pr\u00f3prio Ollama com as alternativas em <a href=\"\/pt\/ollama-vs-lm-studio-vs-vllm-vs-llama-cpp-2026\/\">Ollama vs LM Studio vs vLLM vs llama.cpp<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Check_a_model_fits_before_you_download\"><\/span>Verifique se o modelo cabe no seu sistema antes de baix\u00e1-lo<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>O erro mais comum \u00e9 baixar um modelo muito grande para sua m\u00e1quina \u2014 ele simplesmente recusar\u00e1 o carregamento ou ficar\u00e1 extremamente lento ao recorrer \u00e0 troca com o disco. Antes de baixar, avalie seu tamanho: como regra aproximada, um modelo quantizado em 4 bits exige pouco menos de 1 GB de mem\u00f3ria por bilh\u00e3o de par\u00e2metros, al\u00e9m de uma margem para o contexto. Nossa ferramenta gratuita <a href=\"\/pt\/llm-vram-calculator\/\">Calculadora de VRAM<\/a> fornece o valor exato de mem\u00f3ria necess\u00e1ria para qualquer modelo e tipo de quantiza\u00e7\u00e3o, e <a href=\"\/pt\/ollama-system-requirements-2026\/\">Requisitos do sistema do Ollama<\/a> explicam detalhadamente a compensa\u00e7\u00e3o entre RAM e VRAM.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Frequently_asked_questions\"><\/span>Perguntas frequentes<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>Como listar os modelos instalados no Ollama?<\/strong> Executar <code>ollama list<\/code> para ver todos os modelos instalados com seus respectivos tamanhos, <code>ollama ps<\/code> para verificar qual est\u00e1 carregado no momento e <code>ollama rm &lt;nome&gt;<\/code> para exclu\u00ed-lo.<\/p>\n<p><strong>Qual \u00e9 o melhor modelo para Ollama?<\/strong> N\u00e3o h\u00e1 um \u00fanico melhor \u2014 tudo depende da sua mem\u00f3ria dispon\u00edvel. O Llama 3.1 8B \u00e9 a melhor escolha geral para m\u00e1quinas com 16 GB; consulte <a href=\"\/pt\/best-local-llms-to-run-on-ollama-2026\/\">nossa lista classificada<\/a> para cada caso de uso.<\/p>\n<p><strong>Quantos modelos o Ollama possui?<\/strong> Centenas, abrangendo fam\u00edlias de modelos para conversa\u00e7\u00e3o, programa\u00e7\u00e3o, vis\u00e3o e incorpora\u00e7\u00e3o (embedding), com m\u00faltiplos tamanhos em cada categoria. A tabela acima cobre os modelos que a maioria das pessoas realmente executa.<\/p>\n<p><strong>Quanta RAM preciso para executar modelos Ollama?<\/strong> 8 GB s\u00e3o suficientes para modelos pequenos (1B\u20134B), 16 GB suportam a popular classe de 7B\u20138B, e 32 GB ou mais \u2014 ou uma GPU \u2014 s\u00e3o necess\u00e1rios para modelos de 27B e superiores. Verifique qualquer modelo com nossa <a href=\"\/pt\/llm-vram-calculator\/\">Calculadora de VRAM<\/a>.<\/p>\n<p><strong>Posso executar esses modelos offline?<\/strong> Sim \u2014 uma vez baixados, todos os modelos Ollama rodam integralmente em sua m\u00e1quina, sem necessidade de conex\u00e3o com a internet, o que constitui justamente a principal raz\u00e3o para usar modelos locais.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_bottom_line\"><\/span>Conclus\u00e3o<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>A lista de modelos Ollama \u00e9 extensa, mas a escolha \u00e9 simples: defina sua necessidade \u2014 conversa\u00e7\u00e3o geral, racioc\u00ednio, programa\u00e7\u00e3o, vis\u00e3o ou incorpora\u00e7\u00e3o \u2014 e selecione o maior modelo dessa categoria que sua mem\u00f3ria consiga suportar. Comece com um modelo de 8B, use <code>ollama list<\/code> para acompanhar o que voc\u00ea j\u00e1 tem instalado e confie sempre na <a href=\"\/pt\/llm-vram-calculator\/\">Calculadora de VRAM<\/a> antes de cada download, garantindo que nunca baixe algo que sua m\u00e1quina n\u00e3o consiga executar. A partir da\u00ed, executar uma IA capaz, local e privada requer apenas alguns comandos.<\/p>\n<p><em>Nomes, tamanhos e disponibilidade dos modelos mudam frequentemente; os valores indicados s\u00e3o aproxima\u00e7\u00f5es baseadas nas configura\u00e7\u00f5es padr\u00e3o vigentes at\u00e9 meados de 2026 \u2014 verifique-os com <code>ollama list<\/code> e com a biblioteca oficial antes de confiar neles.<\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>The full Ollama models list for 2026 \u2014 every popular model with parameters, download size and RAM\/VRAM needs, plus how to list and pull models.<\/p>","protected":false},"author":1,"featured_media":1361,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[3],"tags":[421,268,256,259,859,422,649],"class_list":["post-1360","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-llms","tag-deepseek","tag-llama-3","tag-local-llm","tag-ollama","tag-open-source-models","tag-qwen","tag-run-llm-locally"],"_links":{"self":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts\/1360","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/comments?post=1360"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts\/1360\/revisions"}],"predecessor-version":[{"id":1362,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/posts\/1360\/revisions\/1362"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/media\/1361"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/media?parent=1360"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/categories?post=1360"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/pt\/wp-json\/wp\/v2\/tags?post=1360"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}