{"id":790,"date":"2026-06-06T01:59:14","date_gmt":"2026-06-06T01:59:14","guid":{"rendered":"https:\/\/convly.ai\/ollama-system-requirements-2026\/"},"modified":"2026-06-15T18:18:09","modified_gmt":"2026-06-15T18:18:09","slug":"ollama-system-requirements-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/","title":{"rendered":"Requisitos del sistema para Ollama en 2026: \u00bfcu\u00e1nta RAM y VRAM necesitas realmente?"},"content":{"rendered":"<p>La raz\u00f3n m\u00e1s com\u00fan por la que un modelo no se ejecuta en Ollama no es un error, sino que el modelo es m\u00e1s grande que la memoria disponible. Ollama en s\u00ed es muy ligero; son los modelos los que exigen recursos hardware. Esta gu\u00eda te proporciona las cifras reales de RAM y VRAM necesarias para cada tama\u00f1o de modelo en 2026, adem\u00e1s de una f\u00f3rmula sencilla para saber qu\u00e9 cabr\u00e1 en tu sistema <em>antes de<\/em> pasar diez minutos descargando algo que no se cargar\u00e1.<\/p>\n<p>Si a\u00fan no has instalado Ollama, comienza con nuestra <a href=\"https:\/\/convly.ai\/es\/how-to-install-ollama-2026\/\">gu\u00eda de instalaci\u00f3n paso a paso<\/a>.<\/p>\n<div class=\"convly-tldr\">\n<h3>Conclusiones clave<\/h3>\n<ul>\n<li><strong>Regla general:<\/strong> un modelo cuantizado (Q4) necesita aproximadamente <strong>0,6 GB de memoria por cada mil millones de par\u00e1metros<\/strong>, m\u00e1s margen para el contexto.<\/li>\n<li><strong>Modelos de 2\u20133 mil millones:<\/strong> se ejecutan en CPU, con ~2\u20134 GB de RAM. Funcionan bien incluso en un port\u00e1til b\u00e1sico.<\/li>\n<li><strong>Modelos de 7\u20138 mil millones:<\/strong> ~6\u20138 GB de RAM\/VRAM. El punto \u00f3ptimo para la mayor\u00eda de los port\u00e1tiles.<\/li>\n<li><strong>Modelos de 27\u201334 mil millones:<\/strong> ~20\u201324 GB de VRAM. Requieren una GPU de gama alta o una Apple Silicon con mucha memoria unificada.<\/li>\n<li><strong>Modelos de 70 mil millones o m\u00e1s:<\/strong> 40 GB o m\u00e1s: una GPU de estaci\u00f3n de trabajo, una configuraci\u00f3n multi-GPU o una memoria unificada de 64 GB o superior.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a38b2f1ca9de\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Alternar<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a38b2f1ca9de\"  aria-label=\"Alternar\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#Why_memory_is_the_whole_story\" >Por qu\u00e9 la memoria lo es todo<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#The_simple_formula\" >La f\u00f3rmula sencilla<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#Requirements_by_model_size\" >Requisitos seg\u00fan el tama\u00f1o del modelo<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#GPU_vs_CPU_vs_Apple_Silicon\" >GPU frente a CPU frente a Apple Silicon<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#How_to_make_a_big_model_fit\" >C\u00f3mo hacer que un modelo grande quepa en tu sistema<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#Storage_and_software_prerequisites_people_forget\" >Requisitos de almacenamiento y software que la gente olvida<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#FAQ\" >Preguntas frecuentes<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#Bottom_line\" >Conclusi\u00f3n<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/es\/ollama-system-requirements-2026\/#Related_articles\" >Art\u00edculos relacionados<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Why_memory_is_the_whole_story\"><\/span>Por qu\u00e9 la memoria lo es todo<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Para generar texto, los pesos de un modelo deben residir en memoria r\u00e1pida: la VRAM de tu GPU o la RAM del sistema si se ejecuta en CPU. Si el modelo no cabe, ocurre una de dos cosas: Ollama traslada parte de \u00e9l a una memoria m\u00e1s lenta (y el rendimiento se desploma), o se niega a cargar mostrando un error de falta de memoria. Todo lo dem\u00e1s \u2014velocidad de la CPU, disco duro, sistema operativo\u2014 importa mucho menos que disponer de suficiente memoria del tipo adecuado.<\/p>\n<p>Dos factores determinan los requisitos:<\/p>\n<ol>\n<li><strong>Cantidad de par\u00e1metros<\/strong> \u2014 un modelo de 7 mil millones tiene 7 mil millones de pesos; un modelo de 70 mil millones tiene diez veces m\u00e1s.<\/li>\n<li><strong>Cuantizaci\u00f3n<\/strong> \u2014 Ollama utiliza pesos comprimidos en formato GGUF. Una cuantizaci\u00f3n de 4 bits (Q4) reduce aproximadamente a la mitad el uso de memoria respecto a una cuantizaci\u00f3n de 8 bits, con una p\u00e9rdida m\u00ednima de calidad, por lo que es el punto \u00f3ptimo predeterminado.<\/li>\n<\/ol>\n<h2><span class=\"ez-toc-section\" id=\"The_simple_formula\"><\/span>La f\u00f3rmula sencilla<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Para un modelo cuantizado de 4 bits \u2014el formato que Ollama descarga por defecto\u2014, estima:<\/p>\n<blockquote>\n<p><strong>Memoria necesaria \u2248 (par\u00e1metros en miles de millones) \u00d7 0,6 GB + sobrecarga del contexto<\/strong><\/p>\n<\/blockquote>\n<p>As\u00ed, un modelo de 7 mil millones necesita aproximadamente 4\u20135 GB, uno de 13 mil millones alrededor de 8 GB, uno de 27 mil millones unos 18\u201320 GB y uno de 70 mil millones 40 GB o m\u00e1s. A\u00f1ade un poco adicional para la cach\u00e9 KV, cuyo tama\u00f1o aumenta conforme tus conversaciones se hacen m\u00e1s largas. Deja siempre varios gigabytes de margen para tu sistema operativo.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Requirements_by_model_size\"><\/span>Requisitos seg\u00fan el tama\u00f1o del modelo<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Tama\u00f1o del modelo<\/th>\n<th>Memoria (Q4)<\/th>\n<th>Se ejecuta en<\/th>\n<th>Ejemplos de modelos<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>2\u20133 mil millones<\/td>\n<td>~2\u20134 GB<\/td>\n<td>CPU \/ cualquier port\u00e1til<\/td>\n<td>Gemma2 2B, Phi-4 mini<\/td>\n<\/tr>\n<tr>\n<td>7\u20138 mil millones<\/td>\n<td>~6\u20138 GB<\/td>\n<td>GPU de entrada \/ port\u00e1til con 16 GB<\/td>\n<td>DeepSeek-R1 7B, Llama 3.3 8B<\/td>\n<\/tr>\n<tr>\n<td>13\u201314 mil millones<\/td>\n<td>~10\u201312 GB<\/td>\n<td>GPU de gama media<\/td>\n<td>Phi-4, Qwen intermedio<\/td>\n<\/tr>\n<tr>\n<td>27\u201334 mil millones<\/td>\n<td>~18\u201324 GB<\/td>\n<td>GPU de gama alta \/ Apple Silicon<\/td>\n<td>Gemma 4 26B, Qwen 3.6 27B<\/td>\n<\/tr>\n<tr>\n<td>70 mil millones<\/td>\n<td>~40\u201348 GB<\/td>\n<td>Estaci\u00f3n de trabajo \/ multi-GPU<\/td>\n<td>Clase Llama 70B<\/td>\n<\/tr>\n<tr>\n<td>200 mil millones+ (MoE)<\/td>\n<td>100 GB+<\/td>\n<td>Servidor \/ memoria unificada masiva<\/td>\n<td>Qwen3 235B-A22B<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Para un an\u00e1lisis m\u00e1s detallado por modelos espec\u00edficos, consulte nuestra gu\u00eda sobre <a href=\"https:\/\/convly.ai\/es\/vram-requirements-every-major-llm-2026\/\">Requisitos de VRAM para cada modelo de lenguaje de gran tama\u00f1o importante<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"GPU_vs_CPU_vs_Apple_Silicon\"><\/span>GPU frente a CPU frente a Apple Silicon<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>GPU NVIDIA<\/strong> \u2014 el est\u00e1ndar de oro. La VRAM es el l\u00edmite f\u00edsico: el modelo debe caber \u00edntegramente en la memoria de su tarjeta para ejecutarse con rapidez. Una tarjeta de 24 GB (RTX 4090\/5090) ejecuta c\u00f3modamente modelos de hasta ~27\u201334 mil millones de par\u00e1metros.<\/p>\n<p><strong>Solo CPU<\/strong> \u2014 funciona con modelos peque\u00f1os (2\u20138 mil millones), pero mucho m\u00e1s lentamente, ya que el ancho de banda de la memoria del sistema no puede igualar al de una GPU. Es perfectamente v\u00e1lido para tareas ligeras en un port\u00e1til sin GPU dedicada.<\/p>\n<p><strong>Apple Silicon<\/strong> \u2014 un caso especial, y muy s\u00f3lido. Debido a que los Mac utilizan <em>memoria unificada<\/em> memoria unificada compartida entre CPU y GPU, un Mac con 64 GB puede cargar modelos que requerir\u00edan una costosa PC con m\u00faltiples GPU. Desde que Ollama v0.19 (marzo de 2026) incorpor\u00f3 el backend MLX, Apple Silicon tambi\u00e9n se volvi\u00f3 mucho m\u00e1s r\u00e1pido, convirtiendo a un Mac con mucha memoria en una de las mejores m\u00e1quinas locales de LLM de una sola unidad disponibles actualmente. Para comparar su rendimiento frente a una GPU discreta, consulte <a href=\"https:\/\/convly.ai\/es\/amd-strix-halo-vs-apple-m4-pro\/\">Strix Halo frente a Apple M4 Pro<\/a>.<\/p>\n<p><strong>GPU AMD<\/strong> \u2014 compatible mediante ROCm. Funciona bien para inferencia en 2026; consulte nuestro <a href=\"https:\/\/convly.ai\/es\/amd-rocm-vs-nvidia-cuda-2026\/\">Comparaci\u00f3n entre ROCm y CUDA<\/a> para conocer su estado actual.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_make_a_big_model_fit\"><\/span>C\u00f3mo hacer que un modelo grande quepa en tu sistema<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Si el modelo que desea supera ligeramente su capacidad de memoria, tiene opciones antes de rendirse:<\/p>\n<ul>\n<li><strong>Utilice una cuantizaci\u00f3n menor<\/strong> \u2014 descargue una variante <code>Q4<\/code> o incluso <code>q3<\/code> en lugar de <code>q8<\/code>. Sacrifica un poco de calidad a cambio de un ahorro importante de memoria.<\/li>\n<li><strong>Elija un modelo m\u00e1s peque\u00f1o<\/strong> \u2014 un modelo bien seleccionado de 8 mil millones suele superar a uno de 27 mil millones que apenas logra ejecutarse y se ve obligado a intercambiar datos con disco.<\/li>\n<li><strong>Acorte la ventana de contexto<\/strong> \u2014 un contexto m\u00e1s peque\u00f1o consume menos memoria para la cach\u00e9 KV.<\/li>\n<li><strong>Cierre otras aplicaciones<\/strong> \u2014 en una m\u00e1quina con CPU o memoria unificada, la RAM libre es su presupuesto.<\/li>\n<\/ul>\n<p>Para elegir un modelo adaptado a su hardware, consulte la secci\u00f3n <a href=\"https:\/\/convly.ai\/es\/best-local-llms-to-run-on-ollama-2026\/\">mejores modelos de lenguaje de gran tama\u00f1o locales para ejecutar en Ollama<\/a>.<\/p>\n<p><!--ai-enriched--><\/p>\n<h2><span class=\"ez-toc-section\" id=\"Storage_and_software_prerequisites_people_forget\"><\/span>Requisitos de almacenamiento y software que la gente olvida<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>La memoria RAM y la VRAM acaparan toda la atenci\u00f3n, pero dos requisitos menos evidentes causan m\u00e1s fallos en las primeras instalaciones que cualquier otro: el espacio en disco y la pila de software subyacente. Si estos fallan, Ollama bien se niega a instalarse o bien falla a mitad de la descarga de un modelo.<\/p>\n<p><strong>Espacio en disco.<\/strong> El binario de Ollama en s\u00ed es peque\u00f1o; reserve aproximadamente <strong>4&nbsp;GB<\/strong> para la instalaci\u00f3n. Son los modelos los que consumen su unidad. Cada modelo se descarga una sola vez y se almacena en cach\u00e9 en el disco, para luego cargarse en memoria durante la ejecuci\u00f3n, por lo que necesita espacio suficiente para almacenar \u00edntegramente los pesos, adem\u00e1s del espacio libre que ya tenga disponible. Como orientaci\u00f3n aproximada con cuantizaci\u00f3n com\u00fan de 4 bits:<\/p>\n<ul>\n<li><strong>Un modelo de 8B<\/strong> (por ejemplo, Llama 3.1 8B): unos 5&nbsp;GB en disco.<\/li>\n<li><strong>Un modelo de clase 20B:<\/strong> aproximadamente 12\u201314&nbsp;GB.<\/li>\n<li><strong>Un modelo de 70B:<\/strong> alrededor de 40&nbsp;GB.<\/li>\n<li><strong>Un modelo MoE muy grande<\/strong> (clase Llama&nbsp;4): 65&nbsp;GB o m\u00e1s.<\/li>\n<\/ul>\n<p>Estos tama\u00f1os se acumulan r\u00e1pidamente. Una colecci\u00f3n casual de varios modelos ocupa entre 30 y 80&nbsp;GB; si conserva varias variantes grandes, superar\u00e1 f\u00e1cilmente los 200&nbsp;GB. Un SSD de 512&nbsp;GB constituye un m\u00ednimo razonable si planea acumular modelos.<\/p>\n<p><strong>Use un SSD, preferiblemente NVMe.<\/strong> Dado que los pesos se leen desde el disco a la RAM o la VRAM cada vez que un modelo se carga por primera vez, una unidad mec\u00e1nica lenta se manifiesta directamente como un arranque lento: un modelo de 40&nbsp;GB tarda mucho en cargarse desde un disco giratorio. Un almacenamiento r\u00e1pido no afecta a la velocidad de generaci\u00f3n de tokens (tokens por segundo) una vez que el modelo ya est\u00e1 cargado, pero hace que la respuesta a la primera solicitud parezca instant\u00e1nea, en lugar de una pausa de 30 segundos.<\/p>\n<p><strong>Sistema operativo y controladores.<\/strong> Ollama se ejecuta de forma nativa en las tres plataformas, pero cada una tiene un requisito m\u00ednimo:<\/p>\n<ul>\n<li><strong>macOS:<\/strong> 11 (Big Sur) o posterior, tanto en Apple Silicon como en procesadores Intel.<\/li>\n<li><strong>Windows:<\/strong> Windows 10 versi\u00f3n 22H2 o posterior (edici\u00f3n Hogar o Profesional), en arquitecturas x86_64 y ARM64; as\u00ed pues, los equipos con Snapdragon lo ejecutan de forma nativa, sin necesidad de emulaci\u00f3n x86.<\/li>\n<li><strong>Linux:<\/strong> la mayor\u00eda de las distribuciones modernas (Ubuntu 18.04+, Debian, Fedora, RHEL, Arch).<\/li>\n<\/ul>\n<p>Para aceleraci\u00f3n mediante GPU tambi\u00e9n necesita controladores actualizados: un controlador NVIDIA reciente \u2014 <strong>versi\u00f3n 531 o superior<\/strong> (y versi\u00f3n 570 o superior para tarjetas antiguas de las generaciones Maxwell y Pascal) \u2014 para CUDA, o una pila de controladores compatibles con Vulkan o ROCm v7 para AMD Radeon. Si falta el controlador adecuado, Ollama pasa silenciosamente a la CPU, lo cual es la causa m\u00e1s frecuente de que una m\u00e1quina \u00abcon una buena GPU\u00bb funcione lentamente.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>Preguntas frecuentes<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>\u00bfCu\u00e1nta memoria RAM necesito para ejecutar Ollama?<\/h3>\n<p>Depende completamente del modelo. El propio Ollama requiere casi nada; es el modelo el que establece el requisito. Como regla general, un modelo cuantizado a 4 bits necesita aproximadamente 0,6 GB por cada mil millones de par\u00e1metros: unos ~4\u20135 GB para un modelo de 7 mil millones, ~8 GB para uno de 13 mil millones y 40 GB o m\u00e1s para uno de 70 mil millones. Deje siempre varios gigabytes libres para su sistema operativo.<\/p>\n<h3>\u00bfPuedo ejecutar Ollama sin GPU?<\/h3>\n<p>S\u00ed. Los modelos peque\u00f1os (2\u20138 mil millones) funcionan bien en CPU, aunque m\u00e1s lentamente que en una GPU. Un modelo como Gemma2 2B necesita solo unos 1,7 GB de RAM y funciona en port\u00e1tiles b\u00e1sicos. Para modelos superiores a ~13 mil millones, una GPU o Apple Silicon con memoria unificada marca una diferencia real.<\/p>\n<h3>\u00bfCu\u00e1nta VRAM necesito para un modelo de 7 mil millones?<\/h3>\n<p>Aproximadamente 6\u20138 GB para un modelo de 7 mil millones cuantizado a 4 bits, incluyendo cierto margen para el contexto. Esto cabe c\u00f3modamente en la mayor\u00eda de las GPU discretas de gama de entrada y en port\u00e1tiles con 16 GB de memoria unificada o del sistema.<\/p>\n<h3>\u00bfPor qu\u00e9 Ollama se ejecuta tan lentamente?<\/h3>\n<p>Casi siempre porque el modelo no cabe \u00edntegramente en la VRAM de su GPU, por lo que parte de \u00e9l se traslada a la memoria del sistema o a la CPU. Compru\u00e9belo con <code>ollama ps<\/code> \u2014 si muestra un uso elevado de la CPU, cambie a un modelo m\u00e1s peque\u00f1o o aplique una cuantizaci\u00f3n m\u00e1s agresiva para que el modelo completo quepa en la memoria r\u00e1pida.<\/p>\n<h3>\u00bfEs bueno un Mac para ejecutar Ollama?<\/h3>\n<p>S\u00ed, a menudo excelente. La memoria unificada de Apple Silicon permite que un Mac con 64 GB ejecute modelos <a href=\"https:\/\/convly.ai\/es\/llm-vram-calculator\/\"  data-wpil-monitor-id=\"62\">que de otro modo requerir\u00edan una costosa PC con m\u00faltiples GPU, y el backend MLX (desde la versi\u00f3n 0.19) tambi\u00e9n lo ha hecho r\u00e1pido. Un Mac con mucha memoria es una de las mejores opciones de una sola m\u00e1quina para LLM locales en 2026.<\/a> that would otherwise need a costly multi-GPU PC, and the MLX backend (since v0.19) made it fast too. A high-memory Mac is one of the best single-machine options for local LLMs in 2026.<\/p>\n<h3>\u00bfCu\u00e1nto espacio en disco necesito para Ollama?<\/h3>\n<p>Planifique unos 4&nbsp;GB para la instalaci\u00f3n de Ollama y a\u00f1ada el tama\u00f1o de cada modelo que descargue. Con cuantizaci\u00f3n de 4 bits, un modelo de 8B ocupa aproximadamente 5&nbsp;GB, uno de 70B alrededor de 40&nbsp;GB y los modelos m\u00e1s grandes superan los 65&nbsp;GB. Una configuraci\u00f3n t\u00edpica con varios modelos ocupa entre 30 y 80&nbsp;GB, por lo que un SSD de 512&nbsp;GB constituye un punto de partida c\u00f3modo. Se recomienda encarecidamente usar un SSD (preferiblemente NVMe), porque los modelos se cargan desde el disco cada vez que se ejecutan por primera vez.<\/p>\n<h3>\u00bfD\u00f3nde almacena Ollama los modelos y puedo moverlos a otra unidad?<\/h3>\n<p>De forma predeterminada, Ollama guarda los modelos descargados en una carpeta oculta dentro del directorio personal \u2014 <strong>~\/.ollama<\/strong> en macOS y Linux, y <strong>%HOMEPATH%.ollama<\/strong> en Windows. Si su unidad del sistema es peque\u00f1a, puede redirigir el almacenamiento a una unidad m\u00e1s grande o externa estableciendo la variable de entorno <strong>OLLAMA_MODELS<\/strong> antes de iniciar Ollama. Esta es la soluci\u00f3n m\u00e1s limpia cuando su unidad de arranque se queda sin espacio.<\/p>\n<h3>\u00bfQu\u00e9 sistemas operativos admite Ollama?<\/h3>\n<p>Ollama se ejecuta de forma nativa en macOS 11 (Big Sur) o posterior, Windows 10 versi\u00f3n 22H2 o posterior (de 64 bits, incluidos dispositivos ARM64 como los port\u00e1tiles Snapdragon) y la mayor\u00eda de las distribuciones modernas de Linux, como Ubuntu 18.04+, Fedora y Arch. Para aceleraci\u00f3n mediante GPU tambi\u00e9n necesita un controlador actualizado: un controlador NVIDIA reciente para CUDA, o un controlador compatible con ROCm\/Vulkan para AMD; de lo contrario, Ollama se ejecutar\u00e1 en la CPU.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Conclusi\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Antes de descargar cualquier cosa, haga r\u00e1pidamente la cuenta: par\u00e1metros \u00d7 0,6 GB para un modelo cuantizado a 4 bits, m\u00e1s un margen de seguridad. Ajuste ese valor a su VRAM (NVIDIA\/AMD) o memoria unificada (Apple), y nunca volver\u00e1 a encontrarse con un frustrante error de memoria insuficiente. En caso de duda, comience con un tama\u00f1o menor del que cree necesario: un modelo que cabe y se ejecuta con rapidez siempre supera a uno m\u00e1s grande que avanza a paso de tortuga.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Art\u00edculos relacionados<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/es\/ollama-vs-jan-2026\/\">Ollama frente a Jan: \u00bfqu\u00e9 aplicaci\u00f3n local de IA gana en 2026?<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/es\/lm-studio-complete-guide-2026\/\">LM Studio: Gu\u00eda completa (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/es\/claude-5-new-ai-models-june-2026\/\">\u00bfExiste Claude 5? Claude Fable 5 y todos los principales modelos de IA de junio de 2026<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/es\/llm-hallucinations-complete-guide\/\">Alucinaciones de modelos de lenguaje en 2026: por qu\u00e9 ocurren y c\u00f3mo evitarlas<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/es\/prompt-engineering-techniques\/\">Ingenier\u00eda de indicaciones (prompt engineering) en 2026: 12 t\u00e9cnicas que realmente funcionan<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/es\/what-is-ollama-complete-guide-2026\/\">\u00bfQu\u00e9 es Ollama? Gu\u00eda completa para ejecutar modelos de lenguaje de gran tama\u00f1o localmente en 2026<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>The number-one reason a model fails to run isn&#8217;t a bug \u2014 it&#8217;s memory. Here&#8217;s exactly how much RAM and VRAM each Ollama model size needs, and a formula to know before you download.<\/p>","protected":false},"author":1,"featured_media":796,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[3],"tags":[642,643,640,644,641,639],"class_list":["post-790","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-llms","tag-local-llm-vram","tag-ollama-gpu","tag-ollama-hardware-requirements","tag-ollama-ram","tag-ollama-requirements","tag-ollama-system-requirements"],"_links":{"self":[{"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/posts\/790","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/comments?post=790"}],"version-history":[{"count":5,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/posts\/790\/revisions"}],"predecessor-version":[{"id":1172,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/posts\/790\/revisions\/1172"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/media\/796"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/media?parent=790"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/categories?post=790"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/es\/wp-json\/wp\/v2\/tags?post=790"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}