{"id":1360,"date":"2026-07-03T01:57:38","date_gmt":"2026-07-03T01:57:38","guid":{"rendered":"https:\/\/convly.ai\/?p=1360"},"modified":"2026-07-03T01:57:38","modified_gmt":"2026-07-03T01:57:38","slug":"ollama-models-list-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/de\/ollama-models-list-2026\/","title":{"rendered":"Ollama-Modellliste (2026): Alle g\u00e4ngigen Modelle, Gr\u00f6\u00dfen und RAM-Anforderungen"},"content":{"rendered":"<p>Wenn Sie Modelle lokal ausf\u00fchren, stammen die meisten davon aus der Ollama-Bibliothek \u2013 doch diese \u00e4ndert sich st\u00e4ndig, und die Namen sind oft kryptisch. Dies ist ein praktischer <strong>Ollama-Modellliste<\/strong> f\u00fcr 2026: die Modelle, die Menschen tats\u00e4chlich nutzen, deren Speicheranforderungen und Einsatzgebiete sowie Anleitungen zum Auflisten bereits installierter Modelle und zum Herunterladen neuer. Ollama l\u00e4dt standardm\u00e4\u00dfig eine 4-Bit-quantisierte Version herunter, weshalb ein \u201e70B\u201c-Modell auf einem leistungsf\u00e4higen Workstation-PC Platz findet und ein \u201e8B\u201c-Modell sogar auf einem Laptop l\u00e4uft. Die unten angegebenen Gr\u00f6\u00dfen sind ungef\u00e4hre Standardwerte \u2013 pr\u00fcfen Sie stets die <a href=\"\/de\/models\/\">Datenbank f\u00fcr KI-Modelle<\/a> oder f\u00fchren Sie <code>ollama list<\/code> aus, um den aktuellen Stand auf Ihrem Ger\u00e4t zu ermitteln.<\/p>\n<div class=\"convly-tldr\">\n<h3>Schnellreferenz<\/h3>\n<ul>\n<li><strong>Ausf\u00fchrung auf jedem Laptop (8\u00a0GB RAM):<\/strong> Llama 3.2 3B, Phi-3 Mini, Gemma 3 4B \u2013 klein, schnell, offline.<\/li>\n<li><strong>Beste Allround-L\u00f6sung (16\u00a0GB):<\/strong> Llama 3.1 8B, Qwen 2.5 7B, Mistral 7B \u2013 der optimale Kompromiss f\u00fcr die meisten Nutzer.<\/li>\n<li><strong>Hohe Qualit\u00e4t (32\u00a0GB+ \/ GPU):<\/strong> Gemma 2 27B, Qwen 2.5 32B, Mixtral 8x7B.<\/li>\n<li><strong>Nahe der Spitzenklasse (Workstation \/ 48&nbsp;GB+):<\/strong> Llama 3.3 70B, DeepSeek-R1 70B.<\/li>\n<li><strong>Schlussfolgern:<\/strong> DeepSeek-R1 als Distillation. <strong>Programmierung:<\/strong> Qwen 2.5 Coder, Code Llama. <strong>Vision:<\/strong> LLaVA. <strong>Embeddings:<\/strong> nomic-embed-text.<\/li>\n<li><strong>Die Regel:<\/strong> W\u00e4hlen Sie anhand Ihres verf\u00fcgbaren Arbeitsspeichers aus \u2013 pr\u00fcfen Sie jedes Modell kostenlos mit unserem <a href=\"\/de\/llm-vram-calculator\/\">VRAM-Rechner<\/a>.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a4777a8455f8\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Umschalten<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a4777a8455f8\"  aria-label=\"Umschalten\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#The_most_popular_Ollama_models_at_a_glance\" >Die beliebtesten Ollama-Modelle im \u00dcberblick<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#How_to_list_the_Ollama_models_you_have_installed\" >So listen Sie die installierten Ollama-Modelle auf<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#How_to_find_and_pull_new_models_from_the_library\" >So finden und laden Sie neue Modelle aus der Bibliothek herunter<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Small_models_%E2%80%94_run_on_almost_any_laptop\" >Kleine Modelle \u2013 laufen auf nahezu jedem Laptop<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Mid-size_models_%E2%80%94_the_16_GB_sweet_spot\" >Mittlere Modelle \u2013 der 16-GB-Goldilocks-Bereich<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Large_models_%E2%80%94_workstation_and_GPU_territory\" >Gro\u00dfe Modelle \u2013 Bereich Workstation und GPU<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Specialised_models_coding_vision_and_embeddings\" >Spezialisierte Modelle: Programmierung, Vision und Embeddings<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Which_Ollama_model_should_you_actually_use\" >Welches Ollama-Modell sollten Sie tats\u00e4chlich verwenden?<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Check_a_model_fits_before_you_download\" >Pr\u00fcfen Sie vor dem Download, ob ein Modell auf Ihr System passt<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#Frequently_asked_questions\" >H\u00e4ufig gestellte Fragen<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/convly.ai\/de\/ollama-models-list-2026\/#The_bottom_line\" >Das Fazit<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"The_most_popular_Ollama_models_at_a_glance\"><\/span>Die beliebtesten Ollama-Modelle im \u00dcberblick<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Jedes der folgenden Modelle ist mit einem einfachen Befehl verf\u00fcgbar: <code>ollama pull &lt;Name&gt;<\/code>\u201eDownload\u201c gibt die ungef\u00e4hre Standardgr\u00f6\u00dfe im 4-Bit-Format (Q4) an; \u201eMindestspeicher\u201c bezeichnet die praktische Untergrenze des erforderlichen Systemspeichers (CPU) oder VRAMs (GPU), um das Modell komfortabel auszuf\u00fchren. Die Parameteranzahlen sind exakt; Gr\u00f6\u00dfenangaben sind N\u00e4herungswerte und k\u00f6nnen sich mit jeder neuen Version \u00e4ndern.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>Modell<\/th>\n<th>Parameter<\/th>\n<th>Download (Q4)<\/th>\n<th>Mindestspeicher<\/th>\n<th>Am besten geeignet f\u00fcr<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Llama 3.2<\/td>\n<td>1B \/ 3B<\/td>\n<td>~1,3&nbsp;\/&nbsp;2&nbsp;GB<\/td>\n<td>4\u20138&nbsp;GB<\/td>\n<td>Edge-Ger\u00e4te, Smartphones, ultraleichte Chat-Anwendungen<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.1<\/td>\n<td>8B<\/td>\n<td>~4,7&nbsp;GB<\/td>\n<td>8\u201316&nbsp;GB<\/td>\n<td>Bestes Allround-Kleinmodell<\/td>\n<\/tr>\n<tr>\n<td>Llama 3.3<\/td>\n<td>70B<\/td>\n<td>~43\u00a0GB<\/td>\n<td>48&nbsp;GB+<\/td>\n<td>Nahe der Spitzenklasse stehendes offenes Modell<\/td>\n<\/tr>\n<tr>\n<td>Gemma 3<\/td>\n<td>1B \/ 4B<\/td>\n<td>~0,8&nbsp;\/&nbsp;3,3&nbsp;GB<\/td>\n<td>4\u20138&nbsp;GB<\/td>\n<td>Effizientes Kleinmodell (Google)<\/td>\n<\/tr>\n<tr>\n<td>Gemma 2<\/td>\n<td>9B \/ 27B<\/td>\n<td>~5,4&nbsp;\/&nbsp;16&nbsp;GB<\/td>\n<td>12\u201332&nbsp;GB<\/td>\n<td>Ausgezeichnetes Verh\u00e4ltnis von Qualit\u00e4t zu Gr\u00f6\u00dfe<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5<\/td>\n<td>0,5B\u201372B<\/td>\n<td>~0,4\u201347&nbsp;GB<\/td>\n<td>ab 4&nbsp;GB<\/td>\n<td>Mehrsprachig, breites Spektrum an Modellgr\u00f6\u00dfen<\/td>\n<\/tr>\n<tr>\n<td>Qwen 2.5 Coder<\/td>\n<td>1,5B\u201332B<\/td>\n<td>~1\u201320&nbsp;GB<\/td>\n<td>8\u00a0GB+<\/td>\n<td>Lokaler Programmierassistent<\/td>\n<\/tr>\n<tr>\n<td>Mistral<\/td>\n<td>7B<\/td>\n<td>~4,1&nbsp;GB<\/td>\n<td>8&nbsp;GB<\/td>\n<td>Schnell und zuverl\u00e4ssig \u2013 Klassiker<\/td>\n<\/tr>\n<tr>\n<td>Mistral Nemo<\/td>\n<td>12B<\/td>\n<td>~7&nbsp;GB<\/td>\n<td>16&nbsp;GB<\/td>\n<td>Langer Kontext mit 128k Token<\/td>\n<\/tr>\n<tr>\n<td>Mixtral<\/td>\n<td>8\u00d77B<\/td>\n<td>ca. 26&nbsp;GB<\/td>\n<td>32&nbsp;GB und mehr<\/td>\n<td>Qualit\u00e4t von Mixture-of-Experts-Modellen<\/td>\n<\/tr>\n<tr>\n<td>Phi-4<\/td>\n<td>14B<\/td>\n<td>~9\u00a0GB<\/td>\n<td>16&nbsp;GB<\/td>\n<td>Schlussfolgern mit einem kleinen Modell<\/td>\n<\/tr>\n<tr>\n<td>Phi-3 Mini<\/td>\n<td>3,8 Mrd.<\/td>\n<td>ca. 2,3&nbsp;GB<\/td>\n<td>8&nbsp;GB<\/td>\n<td>Klein, aber leistungsf\u00e4hig<\/td>\n<\/tr>\n<tr>\n<td>DeepSeek-R1 (Distill)<\/td>\n<td>1,5\u201370 Mrd.<\/td>\n<td>ca. 1,1\u201343&nbsp;GB<\/td>\n<td>8\u00a0GB+<\/td>\n<td>Schrittweises Schlussfolgern<\/td>\n<\/tr>\n<tr>\n<td>LLaVA<\/td>\n<td>7\u201334 Mrd.<\/td>\n<td>ca. 4,7\u201320&nbsp;GB<\/td>\n<td>8\u00a0GB+<\/td>\n<td>Vision (Bildverst\u00e4ndnis)<\/td>\n<\/tr>\n<tr>\n<td>nomic-embed-text<\/td>\n<td>\u2014<\/td>\n<td>ca. 0,3&nbsp;GB<\/td>\n<td>2&nbsp;GB<\/td>\n<td>Embeddings f\u00fcr RAG\/Suche<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>M\u00f6chten Sie die Cloud-Modelle, mit denen diese Modelle hinsichtlich Preis und Geschwindigkeit verglichen werden, kennenlernen? Die <a href=\"\/de\/models\/\">Datenbank f\u00fcr KI-Modelle<\/a> listet offene und geschlossene Modelle nebeneinander auf, und die <a href=\"\/de\/ai-api-cost-calculator\/\">KI-API-Kostenrechner<\/a> zeigt, wann das lokale Ausf\u00fchren kosteng\u00fcnstiger ist als die Bezahlung pro Token.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_list_the_Ollama_models_you_have_installed\"><\/span>So listen Sie die installierten Ollama-Modelle auf<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Um alle bereits auf Ihrem Rechner vorhandenen Modelle samt Gr\u00f6\u00dfe und letztem Nutzungzeitpunkt anzuzeigen, f\u00fchren Sie folgenden Befehl aus:<\/p>\n<p><code>ollama list<\/code><\/p>\n<p>Dieser Befehl gibt jeweils den Namen, das Tag, die eindeutige ID und die Gr\u00f6\u00dfe jedes Modells aus. Um aktuell im Arbeitsspeicher geladene Modelle anzuzeigen, verwenden Sie <code>ollama ps<\/code>; um ein nicht mehr ben\u00f6tigtes Modell zu entfernen und Speicherplatz freizugeben, nutzen Sie <code>ollama rm &lt;Name&gt;<\/code>. Diese drei Befehle \u2013 <code>list<\/code>, <code>ps<\/code> und <code>rm<\/code> \u2013 reichen vollst\u00e4ndig aus, um Ihre lokale Modellsammlung zu verwalten.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"How_to_find_and_pull_new_models_from_the_library\"><\/span>So finden und laden Sie neue Modelle aus der Bibliothek herunter<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Der vollst\u00e4ndige Katalog von Ollama befindet sich in seiner Online-Bibliothek; das Herunterladen eines beliebigen Modells erfolgt mit einem einzigen Befehl:<\/p>\n<p><code>ollama pull llama3.1<\/code> &nbsp;oder f\u00fchren Sie es direkt mit&nbsp; <code>ollama run llama3.1<\/code><\/p>\n<p>aus. Modellnamen verwenden Tags zur Kennzeichnung von Gr\u00f6\u00dfe und Variante \u2013 z.\u202fB. <code>llama3.1:8b<\/code>, <code>gemma2:27b<\/code>, <code>qwen2.5:14b<\/code>. Wenn Sie das Tag weglassen, l\u00e4dt Ollama automatisch eine sinnvolle Standardvariante (meist die popul\u00e4rste Gr\u00f6\u00dfe mit 4-Bit-Quantisierung). F\u00fcr die erste Installation finden Sie in unserem <a href=\"\/de\/how-to-install-ollama-2026\/\">schrittweisen Installationsleitfaden f\u00fcr Ollama<\/a> Anleitungen f\u00fcr Mac, Windows und Linux.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Small_models_%E2%80%94_run_on_almost_any_laptop\"><\/span>Kleine Modelle \u2013 laufen auf nahezu jedem Laptop<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Modelle mit 1 bis etwa 4 Milliarden Parametern laufen problemlos auf einem modernen Laptop mit 8&nbsp;GB RAM \u2013 eine GPU ist nicht erforderlich. <strong>Llama 3.2 3B<\/strong>, <strong>Gemma 3 4B<\/strong> und <strong>Phi-3 Mini<\/strong> sind die herausragenden Vertreter: schnell, tats\u00e4chlich n\u00fctzlich f\u00fcr Zusammenfassungen, Textentw\u00fcrfe und einfache Fragen \u2013 und klein genug, um st\u00e4ndig im Arbeitsspeicher gehalten zu werden. Sie erreichen zwar nicht die Leistungsf\u00e4higkeit modernster Cloud-Modelle, doch f\u00fcr private, offline durchgef\u00fchrte Alltagsaufgaben sind sie ausgezeichnet \u2013 und stellen den idealen Einstiegspunkt dar, wenn Sie neu im Bereich lokaler KI sind.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Mid-size_models_%E2%80%94_the_16_GB_sweet_spot\"><\/span>Mittlere Modelle \u2013 der 16-GB-Goldilocks-Bereich<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Die Modellklasse mit 7\u201314 Milliarden Parametern ist der Bereich, in dem die meisten Nutzer am besten aufgehoben sind. <strong>Llama 3.1 8B<\/strong>, <strong>Qwen 2.5 7B<\/strong> und <strong>Mistral 7B<\/strong> bieten einen deutlichen Sprung bei Koh\u00e4renz gegen\u00fcber den kleineren Modellen und passen dennoch problemlos in 16&nbsp;GB RAM oder eine g\u00e4ngige GPU. <strong>Phi-4<\/strong> und <strong>Mistral Nemo<\/strong> steigern Qualit\u00e4t und Kontextl\u00e4nge weiter. Wenn Sie ein universell einsetzbares Modell suchen, w\u00e4hlen Sie aus dieser Zeile \u2013 hier finden Sie das beste Verh\u00e4ltnis aus Leistungsf\u00e4higkeit und Hardwareanforderungen.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Large_models_%E2%80%94_workstation_and_GPU_territory\"><\/span>Gro\u00dfe Modelle \u2013 Bereich Workstation und GPU<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Ab 27 Milliarden Parametern ben\u00f6tigen Sie ernsthafte Hardware. <strong>Gemma 2 27B<\/strong> und <strong>Qwen 2.5 32B<\/strong> erfordert mindestens 32&nbsp;GB (besser mehr); <strong>Mixtral 8x7B<\/strong> sowie Modelle der 70-Milliarden-Klasse \u2013 <strong>Llama 3.3 70B<\/strong> und das <strong>DeepSeek-R1 70B<\/strong> (Distill) \u2013 ben\u00f6tigen 48&nbsp;GB oder mehr schnellen Arbeitsspeicher, was in der Praxis entweder eine GPU mit hohem VRAM oder einen Apple-Silicon-Mac mit viel Arbeitsspeicher bedeutet. Der Gewinn ist eine Qualit\u00e4t, die den gro\u00dfen Cloud-Modellen nahekommt \u2013 vollst\u00e4ndig auf Ihrem eigenen Ger\u00e4t ausgef\u00fchrt. Weitere Informationen dazu finden Sie in unserem <a href=\"\/de\/best-gpus-for-ai-2026\/\">beste GPUs f\u00fcr KI<\/a> Leitfaden zu den tats\u00e4chlich kompatiblen Systemen.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Specialised_models_coding_vision_and_embeddings\"><\/span>Spezialisierte Modelle: Programmierung, Vision und Embeddings<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Neben allgemeinen Chat-Modellen bietet Ollama auch aufspezielle Aufgaben zugeschnittene Modelle an. <strong>Qwen 2.5 Coder<\/strong> und <strong>Code Llama<\/strong> sind speziell f\u00fcr Programmieraufgaben konzipiert und integrieren sich hervorragend mit lokalen IDE-Tools. <strong>LLaVA<\/strong> erweitert die F\u00e4higkeiten um Vision, sodass ein Modell Bilder beschreiben oder \u00fcber sie schlussfolgern kann. Und Embedding-Modelle wie <strong>nomic-embed-text<\/strong> und <strong>mxbai-embed-large<\/strong> unterhalten sich \u00fcberhaupt nicht \u2013 sie wandeln Text in Vektoren f\u00fcr die Suche und die retrieval-augmented generation (RAG) um, die Grundlage eines lokalen RAG-Setups ist.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Which_Ollama_model_should_you_actually_use\"><\/span>Welches Ollama-Modell sollten Sie tats\u00e4chlich verwenden?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Die ehrliche Antwort lautet: das gr\u00f6\u00dfte Modell, das Ihr Arbeitsspeicher in der gew\u00fcnschten Klasse aufnehmen kann. F\u00fcr den allgemeinen Einsatz beginnen Sie mit einem 8B-Modell und steigen nur dann auf ein gr\u00f6\u00dferes Modell auf, wenn die Qualit\u00e4t unzureichend ist. F\u00fcr Schlussfolgerungsaufgaben probieren Sie eine DeepSeek-R1-Distillation aus; f\u00fcr Programmieraufgaben eignet sich Qwen 2.5 Coder; f\u00fcr Bildaufgaben LLaVA. Wir bewerten die besten Modelle nach Anwendungsfall in <a href=\"\/de\/best-local-llms-to-run-on-ollama-2026\/\">den besten lokalen LLMs f\u00fcr Ollama<\/a>, und vergleichen Ollama selbst mit den Alternativen in <a href=\"\/de\/ollama-vs-lm-studio-vs-vllm-vs-llama-cpp-2026\/\">Ollama vs. LM Studio vs. vLLM vs. llama.cpp<\/a>.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Check_a_model_fits_before_you_download\"><\/span>Pr\u00fcfen Sie vor dem Download, ob ein Modell auf Ihr System passt<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Der h\u00e4ufigste Fehler besteht darin, ein Modell herunterzuladen, das zu gro\u00df f\u00fcr Ihre Maschine ist \u2013 es wird entweder gar nicht geladen oder l\u00e4uft extrem langsam, weil es auf die Festplatte auslagert. Bevor Sie ein Modell herunterladen, pr\u00fcfen Sie dessen Speicherbedarf: Als grobe Faustregel ben\u00f6tigt ein 4-Bit-Modell knapp unter 1 GB Arbeitsspeicher pro Milliarde Parameter zuz\u00fcglich Puffer f\u00fcr den Kontext. Unser kostenloser <a href=\"\/de\/llm-vram-calculator\/\">VRAM-Rechner<\/a> berechnet die exakte Speichergr\u00f6\u00dfe f\u00fcr jedes Modell und jede Quantisierung, und <a href=\"\/de\/ollama-system-requirements-2026\/\">Systemanforderungen von Ollama<\/a> erl\u00e4utern ausf\u00fchrlich den Kompromiss zwischen Arbeitsspeicher (RAM) und Grafikspeicher (VRAM).<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Frequently_asked_questions\"><\/span>H\u00e4ufig gestellte Fragen<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>Wie liste ich die in Ollama installierten Modelle auf?<\/strong> Ausf\u00fchren <code>ollama list<\/code> um alle installierten Modelle mit ihrer jeweiligen Gr\u00f6\u00dfe anzuzeigen, <code>ollama ps<\/code> um das aktuell geladene Modell anzuzeigen, und <code>ollama rm &lt;Name&gt;<\/code> um ein Modell zu l\u00f6schen.<\/p>\n<p><strong>Welches ist das beste Ollama-Modell?<\/strong> Es gibt kein einzelnes \u201ebestes\u201c Modell \u2013 die Wahl h\u00e4ngt von Ihrem verf\u00fcgbaren Arbeitsspeicher ab. Llama 3.1 8B ist die beste Allround-Wahl f\u00fcr Rechner mit 16 GB RAM; weitere Empfehlungen nach Anwendungsfall finden Sie in <a href=\"\/de\/best-local-llms-to-run-on-ollama-2026\/\">unserer Rangliste<\/a> .<\/p>\n<p><strong>Wie viele Modelle bietet Ollama an?<\/strong> Hunderte Modelle aus den Bereichen Chat, Programmierung, Vision und Embeddings, jeweils in mehreren Gr\u00f6\u00dfenklassen. Die obige Tabelle enth\u00e4lt diejenigen Modelle, die tats\u00e4chlich am h\u00e4ufigsten genutzt werden.<\/p>\n<p><strong>Wie viel Arbeitsspeicher ben\u00f6tige ich, um Ollama-Modelle auszuf\u00fchren?<\/strong> Mit 8 GB RAM k\u00f6nnen kleine Modelle (1B\u20134B) ausgef\u00fchrt werden, mit 16 GB RAM laufen die g\u00e4ngigen 7B\u20138B-Modelle, w\u00e4hrend f\u00fcr 27B-Modelle und gr\u00f6\u00dfer mindestens 32 GB RAM oder eine GPU erforderlich sind. \u00dcberpr\u00fcfen Sie jeden Modellbedarf mit unserem <a href=\"\/de\/llm-vram-calculator\/\">VRAM-Rechner<\/a>.<\/p>\n<p><strong>Kann ich diese Modelle offline betreiben?<\/strong> Ja \u2013 sobald ein Modell einmal heruntergeladen ist, l\u00e4uft es vollst\u00e4ndig lokal auf Ihrem Rechner ohne Internetverbindung. Dies ist der Hauptgrund, warum man \u00fcberhaupt auf lokale Modelle zur\u00fcckgreift.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_bottom_line\"><\/span>Das Fazit<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Die Liste der Ollama-Modelle ist lang, doch die Auswahl ist einfach: Entscheiden Sie zun\u00e4chst, wof\u00fcr Sie das Modell ben\u00f6tigen \u2013 allgemeine Unterhaltung, logisches Schlie\u00dfen, Programmierung, Bildverarbeitung oder Embeddings \u2013 und w\u00e4hlen Sie dann das gr\u00f6\u00dftm\u00f6gliche Modell aus dieser Kategorie, das Ihr Arbeitsspeicher aufnehmen kann. Beginnen Sie mit einem 8B-Modell, nutzen Sie <code>ollama list<\/code> um den \u00dcberblick \u00fcber Ihre Modelle zu behalten, und konsultieren Sie vor jedem Download stets die <a href=\"\/de\/llm-vram-calculator\/\">VRAM-Rechner<\/a> \u2013 so vermeiden Sie, ein Modell herunterzuladen, das Ihre Maschine nicht ausf\u00fchren kann. Ab diesem Punkt ist die lokale und private Nutzung leistungsf\u00e4higer KI nur noch wenige Befehle entfernt.<\/p>\n<p><em>Modellnamen, -gr\u00f6\u00dfen und -verf\u00fcgbarkeit \u00e4ndern sich regelm\u00e4\u00dfig; die angegebenen Werte sind ungef\u00e4hre Standardwerte, g\u00fcltig ab Mitte 2026 \u2013 \u00fcberpr\u00fcfen Sie diese daher stets mit <code>ollama list<\/code> und der offiziellen Bibliothek, bevor Sie sich darauf verlassen.<\/em><\/p>","protected":false},"excerpt":{"rendered":"<p>The full Ollama models list for 2026 \u2014 every popular model with parameters, download size and RAM\/VRAM needs, plus how to list and pull models.<\/p>","protected":false},"author":1,"featured_media":1361,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[3],"tags":[421,268,256,259,859,422,649],"class_list":["post-1360","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-llms","tag-deepseek","tag-llama-3","tag-local-llm","tag-ollama","tag-open-source-models","tag-qwen","tag-run-llm-locally"],"_links":{"self":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1360","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/comments?post=1360"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1360\/revisions"}],"predecessor-version":[{"id":1362,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1360\/revisions\/1362"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/media\/1361"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/media?parent=1360"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/categories?post=1360"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/tags?post=1360"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}