{"id":1102,"date":"2026-06-15T18:14:18","date_gmt":"2026-06-15T18:14:18","guid":{"rendered":"https:\/\/convly.ai\/best-mini-pc-for-local-ai-2026\/"},"modified":"2026-06-15T18:17:52","modified_gmt":"2026-06-15T18:17:52","slug":"best-mini-pc-for-local-ai-2026","status":"publish","type":"post","link":"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/","title":{"rendered":"Die besten Mini-PCs f\u00fcr lokale KI-Anwendungen im Jahr 2026: Ein Kaufberater"},"content":{"rendered":"<p>Vor zwei Jahren bedeutete das Ausf\u00fchren eines leistungsf\u00e4higen Sprachmodells zu Hause einen Turm voller zwei oder drei GPUs, eine 1.000-Watt-Stromversorgung und ein L\u00fcfterprofil, das wie ein Haartrockner klang. Im Jahr 2026 k\u00f6nnen Sie jedoch die meiste dieser Arbeit mit einem Ger\u00e4t erledigen, das in Ihre Handfl\u00e4che passt und Strom wie ein Laptop verbraucht. Der Haken dabei ist, dass sich der Markt f\u00fcr Mini-PCs in Ger\u00e4te aufgeteilt hat, die optisch \u00e4hnlich wirken, sich aber beim Laden eines Modells sehr unterschiedlich verhalten.<\/p>\n<p>Dieser Leitfaden schafft hier Klarheit. Wir vergleichen die vier Klassen kleiner Formfaktor-Ger\u00e4te, die aktuell tats\u00e4chlich f\u00fcr lokale KI relevant sind \u2013 Apples Mac mini, NVIDIAs DGX Spark, AMDs Ryzen AI Max+ (\u201eStrix Halo\u201c)-Systeme sowie Intel-Mini-PCs mit integrierter NPU \u2013 anhand verifizierter Spezifikationen, aktueller Preise und realer Token-pro-Sekunde-Werte. Am Ende dieses Artikels wissen Sie genau, welches Ger\u00e4t f\u00fcr die von Ihnen gew\u00fcnschten Modelle geeignet ist \u2013 und welche Angaben im Datenblatt eher Marketing als echte Leistung widerspiegeln.<\/p>\n<div class=\"convly-tldr\">\n<h3>Wichtigste Erkenntnisse<\/h3>\n<ul>\n<li><strong>Die Speicherkapazit\u00e4t bestimmt, was passt; die Speicherbandbreite bestimmt, wie schnell es l\u00e4uft.<\/strong> Beide Werte sind entscheidend, doch das Marketing betont \u00fcblicherweise nur einen davon.<\/li>\n<li><strong>Das Mac mini M4 Pro (~ 1.999 US-Dollar, 48 GB) ist der beste Allrounder<\/strong> f\u00fcr die meisten Nutzer: leise, bei Last ca. 30 W Stromverbrauch und problemlos bis hin zu Modellen mit rund 32 Milliarden Parametern nutzbar. Beachten Sie, dass die 64-GB-Variante infolge des Speicherengpasses im Jahr 2026 vom Markt genommen wurde; daher stellt 48 GB derzeit die praktische Obergrenze dar.<\/li>\n<li><strong>NVIDIAs DGX Spark (zum Startpreis von 3.999 US-Dollar, danach ab Februar 2026 f\u00fcr 4.699 US-Dollar) bietet 128 GB<\/strong> und \u00fcbertrifft bei der Prompt-Verarbeitung alle Konkurrenten \u2013 seine Bandbreite von 273 GB\/s begrenzt die Token-Generierung jedoch bei standardisierten Tests auf etwa 38 Tok\/s f\u00fcr ein 120-Milliarden-Parameter-Modell.<\/li>\n<li><strong>Mini-PCs mit AMD Strix Halo (ab ca. 1.500 US-Dollar) erreichen dank derselben Technik des einheitlichen Arbeitsspeichers dieselbe Generierungsgeschwindigkeit wie der Spark<\/strong> zu einem Bruchteil des Preises, liegen jedoch deutlich hinterher, wenn es um die Prompt-Verarbeitung geht.<\/li>\n<li><strong>Intel-Mini-PCs eignen sich f\u00fcr kleine Modelle und NPU-Offload, nicht f\u00fcr Aufgaben der 70-Milliarden-Parameter-Klasse<\/strong> \u2013 n\u00fctzlich und g\u00fcnstig, aber einer anderen Kategorie zuzuordnen.<\/li>\n<li><strong>Kein Mini-PC \u00fcbertrifft einen Multi-GPU-Desktop hinsichtlich reiner Generierungsgeschwindigkeit.<\/strong> Sie kaufen diese Ger\u00e4te wegen ihrer kompakten Gr\u00f6\u00dfe, ihres ger\u00e4uschlosen Betriebs, ihres geringen Stromverbrauchs und ihres gro\u00dfen einheitlichen Arbeitsspeichers \u2013 nicht wegen maximaler Durchsatzleistung.<\/li>\n<\/ul>\n<\/div>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_84 counter-flat ez-toc-counter ez-toc-container-direction\">\n<label for=\"ez-toc-cssicon-toggle-item-6a38bc28d6494\" class=\"ez-toc-cssicon-toggle-label\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Umschalten<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #000000;color:#000000\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #000000;color:#000000\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input type=\"checkbox\"  id=\"ez-toc-cssicon-toggle-item-6a38bc28d6494\"  aria-label=\"Umschalten\" \/><nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#Unified_memory_vs_VRAM_the_one_concept_that_explains_everything\" >Einheitlicher Arbeitsspeicher vs. VRAM: Das eine Konzept, das alles erkl\u00e4rt<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#Apple_Mac_mini_M4_M4_Pro_the_default_pick\" >Apple Mac mini (M4 \/ M4 Pro): Die Standardempfehlung<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#NVIDIA_DGX_Spark_128GB_and_a_CUDA_stack_at_a_price\" >NVIDIA DGX Spark: 128 GB und ein CUDA-Stack \u2013 allerdings zu einem Preis<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#AMD_Ryzen_AI_Max_395_Strix_Halo_the_value_play\" >AMD Ryzen AI Max+ 395 (Strix Halo): Die kosteneffiziente Alternative<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#Intel_mini_PCs_small_models_and_NPU_offload\" >Intel-Mini-PCs: Kleine Modelle und NPU-Offload<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#The_comparison_table\" >Die Vergleichstabelle<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#Recommendations_by_use_case\" >Empfehlungen nach Anwendungsfall<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#FAQ\" >H\u00e4ufig gestellte Fragen (FAQ)<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#Bottom_line\" >Fazit<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/convly.ai\/de\/best-mini-pc-for-local-ai-2026\/#Related_articles\" >Verwandte Artikel<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Unified_memory_vs_VRAM_the_one_concept_that_explains_everything\"><\/span>Einheitlicher Arbeitsspeicher vs. VRAM: Das eine Konzept, das alles erkl\u00e4rt<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Jede der folgenden Empfehlungen basiert auf dieser Unterscheidung \u2013 daher lohnt es sich, kurz innezuhalten.<\/p>\n<p>Eine herk\u00f6mmliche GPU verf\u00fcgt \u00fcber ihren eigenen dedizierten VRAM. Eine RTX 4090 besitzt beispielsweise 24 GB; passt Ihr Modell inklusive Kontext nicht in diese 24 GB, l\u00e4uft es auf dieser Karte einfach nicht \u2013 Punkt. VRAM ist schnell \u2013 bei der 4090 liegt die Bandbreite bei rund 1.008 GB\/s \u2013 doch relativ zur Gr\u00f6\u00dfe moderner Modelle steht nie viel davon zur Verf\u00fcgung.<\/p>\n<p><strong>Einheitlicher Arbeitsspeicher<\/strong> kehrt diesen Trade-off um. Apples M-Serie, NVIDIAs GB10 und AMDs Strix Halo teilen sich jeweils einen einzigen Speicherpool zwischen CPU und GPU. Ein System mit 128 GB kann daher mehr als 96 GB f\u00fcr ein Modell reservieren. So kann ein palmgro\u00dfes Ger\u00e4t ein 120-Milliarden-Parameter-Modell ausf\u00fchren, das auf keiner einzelnen Consumer-GPU Platz finden w\u00fcrde. Der Preis daf\u00fcr ist die Bandbreite: Einheitlicher LPDDR5x-Speicher erreicht lediglich etwa 120\u2013275 GB\/s \u2013 nur ein Bruchteil der Bandbreite diskreter VRAM-Module. Da die Token-Generierung speicherbandbreitengebunden ist, legt diese Bandbreite Ihre Token-pro-Sekunde-Rate fest \u2013 unabh\u00e4ngig davon, wie viel Rechenleistung der Chip theoretisch bereitstellen k\u00f6nnte. Behalten Sie diese beiden Zahlen (Kapazit\u00e4t und Bandbreite) im Hinterkopf, und jedes Datenblatt wird pl\u00f6tzlich lesbar. F\u00fcr das vollst\u00e4ndige Bild aus Sicht der GPU lesen Sie unseren erg\u00e4nzenden Artikel zum <a href=\"\/de\/best-gpus-for-local-llms-2026\/\">beste GPUs f\u00fcr lokale LLMs im Jahr 2026<\/a>.<\/p>\n<p>Ein Hinweis zum Benchmark-Modell, das wir im Folgenden verwenden: gpt-oss-120B ist ein Mixture-of-Experts-Modell mit insgesamt etwa 117 Milliarden Parametern, wobei pro Token jedoch nur ca. 5,1 Milliarden aktiv sind. Genau diese MoE-Architektur erm\u00f6glicht es, eine quantisierte Version dieses Modells auch auf diesen Ger\u00e4ten mit einheitlichem Arbeitsspeicher und beschr\u00e4nkter Bandbreite auszuf\u00fchren \u2013 und zwar mit nutzbaren Geschwindigkeiten.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Apple_Mac_mini_M4_M4_Pro_the_default_pick\"><\/span>Apple Mac mini (M4 \/ M4 Pro): Die Standardempfehlung<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Das Mac mini bleibt weiterhin die einfachste Empfehlung f\u00fcr die gr\u00f6\u00dfte Nutzergruppe; die Preis\u00e4nderungen im Jahr 2026 haben diese Position sogar noch verst\u00e4rkt. Nachdem Apple im Mai 2026 die Speichervariante mit 256 GB Festplattenspeicher eingestellt hatte, beginnt das Basis-M4-mini nun bei 799 US-Dollar (16 GB einheitlicher Arbeitsspeicher, 512 GB SSD), wobei zus\u00e4tzlich eine Variante mit 24 GB Arbeitsspeicher erh\u00e4ltlich ist.<\/p>\n<p>Das Basis-M4 verf\u00fcgt \u00fcber eine 10-Core-GPU und eine Bandbreite von 120 GB\/s \u2013 ausreichend f\u00fcr Modelle der 8-Milliarden-Klasse, bei denen es auf Llama 3.2 8B in Q4-Qualit\u00e4t rund 18\u201322 Tok\/s erreicht. F\u00fcr ernsthafte lokale KI-Anwendungen ben\u00f6tigen Sie jedoch das <strong>M4 Pro<\/strong>M4 Pro <strong>mit einer Bandbreite von<\/strong> 273 GB\/s<\/p>\n<p>\u2013 mehr als das Doppelte der Basis-Chip-Bandbreite. In der Konfiguration mit 48 GB (ca. 1.999 US-Dollar) fasst es problemlos ein auf Q4 quantisiertes 32-Milliarden-Parameter-Modell vollst\u00e4ndig im Arbeitsspeicher und erreicht damit bei Qwen 2.5 32B Geschwindigkeiten im Bereich von 10\u201315 Tok\/s.<\/p>\n<p>Ein wichtiger Hinweis vor dem Kauf: Obwohl die technischen Spezifikationen des M4 Pro bis zu 64 GB Arbeitsspeicher unterst\u00fctzen, hat Apple die 64-GB-Konfiguration w\u00e4hrend des DRAM-Mangels im Jahr 2026 vom Markt genommen. Stand Mitte 2026 ist die h\u00f6chste zuverl\u00e4ssig bestellbare Variante daher 48 GB. Falls Sie explizit mehr als diese Kapazit\u00e4t ben\u00f6tigen, stellen die unten beschriebenen Ger\u00e4te mit 128 GB einheitlichem Arbeitsspeicher den realistischen Weg dar. <a href=\"\/de\/what-is-ollama-complete-guide-2026\/\">umfassenden Leitfaden zu Ollama<\/a> Was das Mac mini \u00fcberzeugt, ist nicht die Spitzenleistung \u2013 sondern das Gesamtpaket. Im Leerlauf verbraucht es etwa 15 W, unter Inferenzlast rund 30 W, und der L\u00fcfter dreht sich kaum h\u00f6rbar hoch. Sie k\u00f6nnen ein solches Ger\u00e4t als st\u00e4ndig aktiven Inferenzserver im Regal stehen lassen und praktisch vergessen. Die Softwareunterst\u00fctzung \u00fcber Ollama, LM Studio und Apples MLX-Framework ist ausgezeichnet. Falls Sie neu im Umgang mit lokalen Modellen sind, empfehlen wir unseren<\/p>\n<div class=\"convly-procons\">\n<div class=\"pros\">\n<h4>Vorteile<\/h4>\n<ul>\n<li>Effektiv lautlos; Leistungsaufnahme von 15\u201330 W<\/li>\n<li>Bestes Software-\u00d6kosystem der Branche (MLX, Ollama, LM Studio)<\/li>\n<li>Die 273 GB\/s Speicherbandbreite des M4 Pro ist bei Gr\u00f6\u00dfe und Preis hervorragend<\/li>\n<li>Wiederverkaufswert und Verarbeitungsqualit\u00e4t sind ausgezeichnet<\/li>\n<\/ul>\n<\/div>\n<div class=\"cons\">\n<h4>Nachteile<\/h4>\n<ul>\n<li>Praktisch auf 48 GB begrenzt (die 64-GB-Variante wurde w\u00e4hrend der Knappheit im Jahr 2026 gestrichen) \u2013 kann Modelle mit \u00fcber 70 Mrd. Parametern nicht bew\u00e4ltigen, die auf Systemen mit 128 GB laufen<\/li>\n<li>Der gemeinsame Arbeitsspeicher ist fest verl\u00f6tet; kaufen Sie daher direkt die ben\u00f6tigte Kapazit\u00e4t<\/li>\n<li>Kein NVIDIA-CUDA-Pfad verf\u00fcgbar, was f\u00fcr bestimmte Trainings- und Feinabstimmungstools relevant ist<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<h2><span class=\"ez-toc-section\" id=\"NVIDIA_DGX_Spark_128GB_and_a_CUDA_stack_at_a_price\"><\/span>NVIDIA DGX Spark: 128 GB und ein CUDA-Stack \u2013 allerdings zu einem Preis<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Der DGX Spark (urspr\u00fcnglich als \u201eProject DIGITS\u201c auf der CES 2025 vorgestellt, im M\u00e4rz 2025 auf der GTC in DGX Spark umbenannt und ab dem 15. Oktober 2025 ausgeliefert) ist NVIDIAs Antwort darauf, einen \u201epers\u00f6nlichen KI-Supercomputer\u201c auf Ihren Schreibtisch zu bringen. Er kombiniert einen GB10 Grace Blackwell-Superchip \u2013 bestehend aus einer 20-Kern-Arm-CPU (10\u00d7 Cortex-X925 + 10\u00d7 Cortex-A725) sowie einer Blackwell-GPU \u2013 mit <strong>128 GB koh\u00e4rentem, gemeinsamem LPDDR5x-Speicher<\/strong>, einer 4-TB-Selbstverschl\u00fcsselungs-SSD und einer ConnectX-7-200-Gbps-NIC zur Verkn\u00fcpfung zweier Einheiten. NVIDIA gibt eine maximale FP4-KI-Leistung von bis zu 1 Petaflop an; laut NVIDIA l\u00e4sst sich damit Inferenz f\u00fcr Modelle mit bis zu etwa 200 Mrd. Parametern durchf\u00fchren oder Fine-Tuning f\u00fcr Modelle mit bis zu etwa 70 Mrd. Parametern vornehmen. Die Stromversorgung erfolgt \u00fcber ein 240-W-Netzteil.<\/p>\n<p>Hier kommt der ehrliche Teil: Der Spark ist ein wahrer Prompt-Verarbeitungsmonster: Bei gpt-oss-120B erreicht er im standardisierten Test rund <strong>1.723 Tok\/s beim Prefill<\/strong> , vergleichbar mit einem Dreifach-RTX-3090-System. Die Token- <em>Generierung<\/em> liegt jedoch nur bei <strong>~38,6 Tok\/s<\/strong> im selben Vergleich, da die Speicherbandbreite des GB10 lediglich <strong>273 GB\/s<\/strong> betr\u00e4gt \u2013 genauso viel wie bei einem Mac mini M4 Pro \u2013 und somit w\u00e4hrend der speicherbandbreitenbegrenzten Decode-Phase die entscheidende Engstelle darstellt. Hochgradig optimierte Inferenz-Stacks (vLLM, SGLang, NVIDIAs eigener TensorRT-LLM) haben Berichten zufolge die Generierungsrate f\u00fcr gpt-oss-120B auf einer einzelnen Einheit mit der richtigen Konfiguration auf 50\u201360 Tok\/s gesteigert; doch diese Bandbreitenobergrenze, die den Spark deutlich hinter Mehr-GPU-Systemen zur\u00fcckh\u00e4lt, beruht auf physikalischen Gegebenheiten \u2013 nicht auf Software.<\/p>\n<p>Dann gibt es noch den Preis: Der Spark wurde urspr\u00fcnglich f\u00fcr 3.999 US-Dollar eingef\u00fchrt und stieg im Februar 2026 infolge von Speicherknappheit auf <strong>$4,699<\/strong> an \u2013 ein Anstieg um 18 %, den NVIDIA auf Engp\u00e4sse bei DRAM und NAND zur\u00fcckf\u00fchrte. Das entspricht etwa 37 US-Dollar pro GB Speicher \u2013 und rein f\u00fcr die Generierungsleistung kostet ein Trio gebrauchter RTX-3090-Karten angeblich weniger und liefert mehrere Male h\u00f6here Geschwindigkeit. Der Spark rechtfertigt seinen Preis, wenn Sie speziell den CUDA-\/NVIDIA-Softwarestack, NVFP4 oder die M\u00f6glichkeit zur Inferenz von Modellen mit bis zu 200 Mrd. Parametern in einem 240-W-Geh\u00e4use ben\u00f6tigen. Wir gehen tiefer darauf ein in unserem <a href=\"\/de\/nvidia-digits-personal-ai-computer-review\/\">DGX-Spark-\/Project-DIGITS-Test<\/a> und dem direkten Vergleich <a href=\"\/de\/nvidia-digits-vs-mac-studio-for-local-ai\/\">DGX Spark vs. Mac Studio<\/a> .<\/p>\n<h2><span class=\"ez-toc-section\" id=\"AMD_Ryzen_AI_Max_395_Strix_Halo_the_value_play\"><\/span>AMD Ryzen AI Max+ 395 (Strix Halo): Die kosteneffiziente Alternative<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>AMDs Strix Halo ist die \u00dcberraschung dieser Generation. Der Flagship-Prozessor <strong>Ryzen AI Max+ 395<\/strong> verf\u00fcgt \u00fcber 16 Zen-5-Kerne, eine 40-Recheneinheiten umfassende RDNA-3.5-GPU (die Radeon 8060S) und eine 50-TOPS-XDNA-2-NPU. In Kombination mit bis zu <strong>128 GB LPDDR5X-Speicher<\/strong>, von denen bis zu 96 GB der GPU zugewiesen werden k\u00f6nnen, nutzt er denselben Trick mit gemeinsamem Speicher wie der Spark \u2013 es l\u00e4sst sich also ein 120-Mrd.-Parameter-Modell ausf\u00fchren, das keinerlei Consumer-GPU allein fassen k\u00f6nnte \u2013 und das zu einem Bruchteil der Kosten.<\/p>\n<p>Der Kompromiss liegt in Bandbreite und Prompt-Verarbeitung: Die Speicherbandbreite des Strix Halo liegt bei maximal etwa 256 GB\/s; bei gpt-oss-120B erreicht er nur <strong>~340 Tok\/s beim Prefill<\/strong> gegen\u00fcber den 1.723 Tok\/s des Spark. Doch hier kommt der entscheidende Punkt: Die Token-Generierung liegt bei <strong>~34 Tok\/s<\/strong>, also nahezu auf Augenh\u00f6he mit den 38 Tok\/s des Spark. Bei Chat-Workloads, bei denen mehr generiert als eingelesen wird, ist der Unterschied gering. F\u00fcr Llama 3.3 70B in Q4 ist mit etwa 12 Tok\/s bei einer Leistungsaufnahme von 80\u2013120 W zu rechnen.<\/p>\n<p>Was ihn attraktiv macht, sind Preis und Wahlm\u00f6glichkeiten. Der Einstiegspreis ist im Zuge der RAM-Knappheit 2026 gestiegen: 64-GB-Versionen des GMKtec EVO-X2 kosten ab etwa 1.500 US-Dollar, w\u00e4hrend die 128-GB-Version des EVO-X2 mittlerweile knapp 2.200 US-Dollar erreicht. Frameworks reparierbare Desktop-Variante beginnt bei rund 1.639 US-Dollar (Barebone, Ryzen AI Max+ 395, 64 GB), ohne Speicher und Betriebssystem; Corsairs AI Workstation 300 startete nahe 2.000 US-Dollar, lag aber w\u00e4hrend der Knappheit deutlich dar\u00fcber. Die Software ist der Haken \u2013 ROCm und llama.cpp funktionieren gut, doch das \u00d6kosystem ist rauer als das von Apple oder NVIDIA, und Windows-KI-Funktionen setzen st\u00e4rker auf die NPU als auf die leistungsstarke GPU.<\/p>\n<div class=\"convly-procons\">\n<div class=\"pros\">\n<h4>Vorteile<\/h4>\n<ul>\n<li>128-GB-Konfigurationen mit gemeinsamem Speicher verf\u00fcgbar \u2013 der kosteng\u00fcnstigste Weg zu Modellen mit \u00fcber 70 Mrd. Parametern<\/li>\n<li>Generierungsgeschwindigkeit nahezu auf Augenh\u00f6he mit dem DGX Spark \u2013 zu einem Bruchteil des Preises<\/li>\n<li>Offene x86-Plattform; unterst\u00fctzt Windows oder Linux, breite App-Kompatibilit\u00e4t<\/li>\n<\/ul>\n<\/div>\n<div class=\"cons\">\n<h4>Nachteile<\/h4>\n<ul>\n<li>Schwache Prompt-Verarbeitung \u2013 Workloads mit langem Kontext oder RAG wirken langsam<\/li>\n<li>ROCm-Tools sind weniger ausgereift als CUDA oder MLX<\/li>\n<li>Fest verl\u00f6teter Speicher; die RAM-Preise 2026 haben die Marktpreise nach oben getrieben<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<h2><span class=\"ez-toc-section\" id=\"Intel_mini_PCs_small_models_and_NPU_offload\"><\/span>Intel-Mini-PCs: Kleine Modelle und NPU-Offload<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Intels Mini-PCs besetzen eine andere Preisklasse \u2013 hier ist es wichtig, keine Fehlk\u00e4ufe zu t\u00e4tigen. Aktuelle Arrow-Lake-H-Chips wie der Core Ultra 9 285H kombinieren eine Arc-iGPU mit einer 13-TOPS-NPU und erreichen insgesamt etwa 99 TOPS an Plattform-KI-Leistung unter Einbeziehung von CPU und GPU; Intels IPEX-LLM-Stack erm\u00f6glicht den Einsatz von Ollama und llama.cpp auf iGPU und NPU. Der gr\u00f6\u00dfere Schritt 2026 ist Panther Lake (Core Ultra Series 3), der auf der CES 2026 vorgestellt wurde und eine 50-TOPS-NPU mit einer deutlich leistungsst\u00e4rkeren GPU kombiniert, um insgesamt bis zu ~180 TOPS Plattform-Leistung zu erreichen \u2013 bleibt jedoch eine Laptop-\/Mobile-Plattform und kein Desktop-System f\u00fcr gro\u00dfe Modelle.<\/p>\n<p>Keines dieser Systeme verf\u00fcgt jedoch \u00fcber gemeinsamen Speicher f\u00fcr gro\u00dfe Modelle. Mit Standard-DDR5 (typischerweise ~120 GB\/s Dual-Channel) und keiner Zuweisung von bis zu 96 GB an die GPU ist ein Intel-Mini-PC das richtige Werkzeug f\u00fcr Modelle mit 3\u20138 Mrd. Parametern, lokale Assistenten, Transkription und NPU-beschleunigte Hintergrundaufgaben \u2013 nicht jedoch f\u00fcr die Ausf\u00fchrung eines 70-Mrd.-Parameter-Modells. Wenn Ihre Anforderung \u201eein quantisiertes 8-Mrd.-Parameter-Modell plus einige Windows-KI-Funktionen\u201c lautet, ist ein Intel-System preisg\u00fcnstig und stromsparend. Wenn es jedoch hei\u00dft \u201edas gr\u00f6\u00dftm\u00f6gliche Modell, das ich unterbringen kann\u201c, sollten Sie sich die oben genannten Systeme mit gemeinsamem Speicher anschauen. Der Kompromiss zwischen NPU und GPU ist ein eigenes Thema, das wir in unserer \u00dcbersicht <a href=\"\/de\/npu-vs-gpu-for-ai-2026\/\">NPU vs. GPU f\u00fcr KI<\/a> ausf\u00fchrlich behandeln.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"The_comparison_table\"><\/span>Die Vergleichstabelle<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Die unten stehenden Generierungswerte beziehen sich auf gpt-oss-120B (Token-Generierung \/ Prompt-Verarbeitung) aus standardisierten, llama.cpp-\u00e4hnlichen Tests, bei denen beide Modelle passen; f\u00fcr kleinere Modelle sind entsprechende Hinweise separat angegeben. Die Preise gelten f\u00fcr Mitte 2026 (in US-Dollar) und schwanken mit der andauernden Speicherknappheit.<\/p>\n<table class=\"convly-vs\">\n<thead>\n<tr>\n<th>System<\/th>\n<th>Einheitlicher Arbeitsspeicher<\/th>\n<th>Bandbreite<\/th>\n<th>Realistische Obergrenze f\u00fcr Modellgr\u00f6\u00dfe<\/th>\n<th>Generierung \/ Prefill (120B)<\/th>\n<th>Stromverbrauch<\/th>\n<th>Preis (2026)<\/th>\n<\/tr>\n<\/thead>\n<tbody>\n<tr>\n<td>Mac mini M4 (Einstiegsmodell)<\/td>\n<td>16\u201332 GB<\/td>\n<td>120 GB\/s<\/td>\n<td>~8\u201314 Mrd. Parameter (Q4)<\/td>\n<td>n.v. (8 Mrd.: ~20 Tok\/s)<\/td>\n<td>~30 W<\/td>\n<td>$799+<\/td>\n<\/tr>\n<tr>\n<td>Mac mini M4 Pro<\/td>\n<td>bis zu 48 GB*<\/td>\n<td>273 GB\/s<\/td>\n<td>~32 Mrd. (Q4)<\/td>\n<td>n\/v (32 Mrd.: 10\u201315 Tok\/s)<\/td>\n<td>~30 W<\/td>\n<td>~$1,999<\/td>\n<\/tr>\n<tr>\n<td>AMD Strix Halo (Ryzen AI Max+ 395)<\/td>\n<td>bis zu 128 GB<\/td>\n<td>~256 GB\/s<\/td>\n<td>~120 Mrd. (Q4, MoE)<\/td>\n<td>34 \/ 340 Tok\/s<\/td>\n<td>80\u2013120 W<\/td>\n<td>1.500\u20133.000+ USD<\/td>\n<\/tr>\n<tr>\n<td>NVIDIA DGX Spark<\/td>\n<td>128 GB<\/td>\n<td>273 GB\/s<\/td>\n<td>~200 Mrd. (Inferenz)<\/td>\n<td>39 \/ 1.723 Tok\/s<\/td>\n<td>max. ~240 W<\/td>\n<td>3.999\u20134.699 USD<\/td>\n<\/tr>\n<tr>\n<td>Intel Arrow Lake-H-Mini-PC<\/td>\n<td>DDR5 (kein gro\u00dfer GPU-Speicherpool)<\/td>\n<td>~120 GB\/s<\/td>\n<td>~8 Mrd. (Q4)<\/td>\n<td>n\/v<\/td>\n<td>~65 W<\/td>\n<td>600\u20131.200 USD<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><em>*Die Spezifikationstabelle des M4 Pro listet 64 GB auf, doch diese Konfiguration wurde w\u00e4hrend der DRAM-Knappheit 2026 vom Markt genommen; 48 GB ist Mitte 2026 die praktische Obergrenze.<\/em><\/p>\n<p>Zum Vergleich: Ein Mac Studio M3 Ultra erreicht eine Bandbreite von etwa 819 GB\/s (und decodiert dasselbe 120-Mrd.-Modell mit rund 70 Tok\/s), w\u00e4hrend ein Dreier-3090-System bei ~124 Tok\/s Decodierung liegt \u2013 beide liegen weit au\u00dferhalb der Mini-PC-Klasse und verdeutlichen, was man zugunsten des kompakten Formfaktors an Leistung opfert. Falls Sie einen gr\u00f6\u00dferen Apple-Rechner ins Auge fassen, behandelt unser <a href=\"\/de\/mac-studio-m4-max-vs-m4-ultra-for-ai\/\">Mac Studio M4 Max vs. M4 Ultra<\/a> Leitfaden diesen Leistungssprung.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Recommendations_by_use_case\"><\/span>Empfehlungen nach Anwendungsfall<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><strong>Die meisten Nutzer \/ stummer, immer aktiver Assistent:<\/strong> Mac mini M4 Pro mit 48 GB. Beste Balance aus Leistungsf\u00e4higkeit, nahezu ger\u00e4uschloser Betriebsweise, einem Stromverbrauch von ~30 W und einem ausgereiften Software-Stack. F\u00fcr den Einsatz ausschlie\u00dflich von 8-Mrd.-Modellen reicht auch die Basiskonfiguration mit 24 GB M4.<\/p>\n<p><strong>Maximale Modellgr\u00f6\u00dfe im Budgetbereich:<\/strong> ein AMD Strix Halo-System (GMKtec EVO-X2, Framework Desktop oder Corsair AI Workstation 300). Mit 128 GB k\u00f6nnen Sie Modelle mit 70\u2013120 Mrd. Parametern laden, die das Mac mini nicht bew\u00e4ltigen kann, und zwar mit Generierungsgeschwindigkeiten, die nahe an denen des deutlich teureren Spark liegen \u2013 und selbst bei knappheitsbedingt erh\u00f6hten Preisen bleibt es deutlich unter dem Preis des Spark.<\/p>\n<p><strong>CUDA-Entwicklung \/ NVIDIA-Workflow \/ intensive Prompt-Verarbeitung:<\/strong> DGX Spark. Hier zahlen Sie einen Aufpreis f\u00fcr den NVIDIA-Stack, NVFP4, ConnectX-Clustering und die branchenf\u00fchrende Prefill-Leistung \u2013 gerechtfertigt nur, wenn genau diese Aspekte f\u00fcr Sie entscheidend sind.<\/p>\n<p><strong>Kleine Modelle f\u00fcr Ger\u00e4te-Intelligenz und NPU-Aufgaben:<\/strong> ein Intel Arrow Lake- oder Panther Lake-Mini-PC. G\u00fcnstig, energieeffizient und ideal dimensioniert f\u00fcr Aufgaben im Bereich von 8-Mrd.-Modellen sowie Windows-KI-Funktionen.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"FAQ\"><\/span>H\u00e4ufig gestellte Fragen (FAQ)<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<h3>Welcher Mini-PC eignet sich 2026 am besten zum lokalen Betrieb von LLMs?<\/h3>\n<p>F\u00fcr die meisten Nutzer ist es das Mac mini M4 Pro mit 48 GB \u2013 leise, stromsparend und leistungsf\u00e4hig bis hin zu ~32-Mrd.-Modellen. Falls Sie Modelle mit 70 Mrd. Parametern oder mehr ben\u00f6tigen, bietet ein AMD Strix Halo-System mit 128 GB die beste Kosten-Nutzen-Relation, w\u00e4hrend der NVIDIA DGX Spark die Premium-CUDA-Option darstellt.<\/p>\n<h3>Wie viel Arbeitsspeicher ben\u00f6tige ich, um ein Modell mit 70 Mrd. Parametern zu betreiben?<\/h3>\n<p>Ein auf Q4 quantisiertes 70-Mrd.-Modell ben\u00f6tigt allein f\u00fcr die Gewichte etwa 40\u201348 GB plus Puffer f\u00fcr den Kontext. Praktisch sollten Sie daher mindestens eine Maschine mit 64 GB w\u00e4hlen und idealerweise 128 GB, um das Modell bequem mit gro\u00dfem Kontextfenster zu betreiben. Damit scheidet das aktuelle 48-GB-Mac mini f\u00fcr die gr\u00f6\u00dften 70-Mrd.-Konfigurationen aus und verweist auf 128-GB-Systeme mit gemeinsamem Speicher.<\/p>\n<h3>Warum ist der NVIDIA DGX Spark beim Token-Generieren langsam, obwohl er \u00fcber 4.000 USD kostet?<\/h3>\n<p>Weil die Token-Generierung durch die Speicherbandbreite begrenzt ist \u2013 und die des Spark mit 273 GB\/s eher bescheiden ist, vergleichbar mit der eines Mac mini M4 Pro. Seine St\u00e4rke liegt vielmehr in der Prompt-Verarbeitung (ca. 1.723 Tok\/s bei einem 120-Mrd.-Modell) und der Kapazit\u00e4t von 128 GB, nicht in der reinen Generierungsgeschwindigkeit, bei der Standardtests ihn bei etwa 38 Tok\/s einstufen (optimierte Stacks erreichen ~50\u201360 Tok\/s).<\/p>\n<h3>Ist gemeinsamer Speicher (unified memory) genauso gut wie dedizierter GPU-Speicher (VRAM)?<\/h3>\n<p>Es handelt sich um einen Kompromiss: Gemeinsamer Speicher bietet deutlich mehr Kapazit\u00e4t (bis zu 128 GB), sodass Sie Modelle betreiben k\u00f6nnen, die auf keiner einzelnen Consumer-GPU Platz finden \u2013 allerdings mit deutlich geringerer Bandbreite als VRAM. F\u00fcr gro\u00dfe Modelle, die anderweitig nicht lauff\u00e4hig w\u00e4ren, ist er die einzige praktikable L\u00f6sung; f\u00fcr kleinere Modelle ist eine diskrete GPU schneller.<\/p>\n<h3>Kann ein Mac mini ein 70-Mrd.-Modell betreiben?<\/h3>\n<p>Eigentlich nicht mehr. Da die 64-GB-Variante w\u00e4hrend der DRAM-Knappheit 2026 vom Markt genommen wurde, ist die h\u00f6chste verf\u00fcgbare Konfiguration des Mac mini M4 Pro mit 48 GB ausgestattet \u2013 gerade ausreichend f\u00fcr ein stark quantisiertes 70-Mrd.-Modell unter engen Bedingungen, wobei der praktische Spielraum bei Q4 maximal bei ~32 Mrd. liegt. F\u00fcr 70-Mrd.-Aufgaben empfiehlt sich stattdessen ein 128-GB-System wie ein Strix Halo-PC, ein Mac Studio oder der DGX Spark.<\/p>\n<h3>Sind AMD Strix Halo-Mini-PCs f\u00fcr KI geeignet, oder ist die Software noch zu unzureichend?<\/h3>\n<p>Sie sind tats\u00e4chlich leistungsf\u00e4hig \u2013 mit 128 GB Speicher und Generierungsgeschwindigkeiten nahe denen des DGX Spark zu einem Bruchteil des Preises. Der Nachteil liegt in der Software: ROCm und llama.cpp funktionieren zwar, sind aber weniger ausgereift als Apples MLX oder NVIDIAs CUDA, und die Prompt-Verarbeitung ist schwach. Wer bereit ist, etwas Setup-Arbeit zu investieren, erh\u00e4lt hier hervorragende Wertigkeit.<\/p>\n<h3>Welchen Stromverbrauch und welche Ger\u00e4uschentwicklung darf ich von diesen Ger\u00e4ten erwarten?<\/h3>\n<p>Das Mac mini ist das leiseste und effizienteste Ger\u00e4t mit ~30 W unter Last und praktisch ger\u00e4uschlosem Betrieb. Strix Halo-Systeme ziehen 80\u2013120 W und verf\u00fcgen \u00fcber h\u00f6rbare, aber moderat laufende L\u00fcfter. Der DGX Spark wird mit einem 240-W-Netzteil ausgeliefert. Alle Ger\u00e4te sind deutlich leiser und stromsparender als ein Multi-GPU-Desktop, der 300\u2013450 W oder mehr verbrauchen kann.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Bottom_line\"><\/span>Fazit<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Die \u00c4ra der Mini-PCs f\u00fcr lokale KI ist Realit\u00e4t \u2013 doch die Marketingaussagen \u00fcbertreiben sie in einem Punkt speziell: Diese Ger\u00e4te \u00fcberzeugen durch ihre Gr\u00f6\u00dfe, Ger\u00e4uschlosigkeit, Energieeffizienz und gro\u00dfen gemeinsamen Speicher \u2013 nicht durch reine Geschwindigkeit. Keines dieser Systeme schl\u00e4gt einen Multi-GPU-Desktop bei Tokens pro Sekunde, und Sie sollten es nicht kaufen, wenn Sie genau das erwarten.<\/p>\n<p>W\u00e4hlen Sie nach der tats\u00e4chlichen Modellgr\u00f6\u00dfe, die Sie einsetzen. F\u00fcr 8\u201332-Mrd.-Modelle mit minimalem Aufwand ist das Mac mini M4 Pro die klare Wahl und die Empfehlung f\u00fcr die meisten Leser. Um 70\u2013120-Mrd.-Modelle ohne Tower zu betreiben, liefert ein AMD Strix Halo-System die beste Leistung pro Dollar, w\u00e4hrend der DGX Spark f\u00fcr Nutzer reserviert bleibt, die gezielt auf NVIDIAs Stack und dessen starke Prompt-Verarbeitung angewiesen sind. Und falls Ihre Anforderungen bei 8-Mrd.-Modellen enden, erledigt ein Intel-Mini-PC die Aufgabe zu geringeren Kosten. Passen Sie den Speicher an das Modell an, beachten Sie die Bandbreitenangabe \u2013 und ignorieren Sie einfach die Petaflop-Zahl auf der Verpackung.<\/p>\n<p><!--related-block--><\/p>\n<div class=\"convly-related\">\n<h2><span class=\"ez-toc-section\" id=\"Related_articles\"><\/span>Verwandte Artikel<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<ul>\n<li><a href=\"https:\/\/convly.ai\/de\/rtx-50-super-for-ai-2026\/\">RTX 5080 Super &amp; 5070 Super f\u00fcr KI: Was die durchgesickerten VRAM-Aktualisierungen f\u00fcr lokale LLMs bedeuten (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/de\/nvidia-vera-rubin-explained-2026\/\">NVIDIA Vera Rubin erkl\u00e4rt: Die n\u00e4chste Generation der KI-Plattform, die die Inferenzkosten um das Zehnfache senkt (2026)<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/de\/rx-9070-xt-vs-rtx-5080-for-ai-2026\/\">AMD RX 9070 XT vs RTX 5080 for AI in 2026: Can AMD Punch Above Its Price?<\/a><\/li>\n<li><a href=\"https:\/\/convly.ai\/de\/rx-9070-xt-vs-rtx-5070-ti-for-ai-2026\/\">AMD RX 9070 XT vs. RTX 5070 Ti f\u00fcr KI im Jahr 2026: Schlie\u00dft ROCm die L\u00fccke?<\/a><\/li>\n<\/ul>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>A no-hype buyer&#8217;s guide to small-form-factor machines for local LLMs in 2026 \u2014 Apple&#8217;s Mac mini, NVIDIA&#8217;s DGX Spark, AMD Strix Halo boxes and Intel \u2014 with verified specs, prices and token-per-second numbers, plus picks by use case.<\/p>","protected":false},"author":1,"featured_media":1112,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[248],"tags":[735,442,345,734,733,298,296,299],"class_list":["post-1102","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-gpus","tag-dgx-spark","tag-llm","tag-local-ai","tag-mac-mini","tag-mini-pc","tag-ryzen-ai-max","tag-strix-halo","tag-unified-memory"],"_links":{"self":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1102","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/comments?post=1102"}],"version-history":[{"count":1,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1102\/revisions"}],"predecessor-version":[{"id":1129,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/posts\/1102\/revisions\/1129"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/media\/1112"}],"wp:attachment":[{"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/media?parent=1102"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/categories?post=1102"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/convly.ai\/de\/wp-json\/wp\/v2\/tags?post=1102"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}