إذا كنت تشغّل النماذج محليًّا، فإن مكتبة أُولاما هي المصدر الذي تأتي منه معظم هذه النماذج — لكنها تتغيّر باستمرار وأسماؤها غامضة. هذا دليل عملي قائمة نماذج أُولاما لعام 2026: النماذج التي يشغلها الناس فعليًّا، والذاكرة المطلوبة لكلٍّ منها، وما يُبرع فيه كل نموذج، بالإضافة إلى كيفية سرد النماذج الموجودة لديك بالفعل وتنزيل نماذج جديدة. ويقوم أُولاما افتراضيًّا بتنزيل نسخة كمية بتقنية التكمية 4-بت، ولذلك يمكن لنموذج «70 مليار معلّمة» أن يعمل على محطة عمل قوية، بينما يشتغل نموذج «8 مليار معلّمة» على جهاز كمبيوتر محمول. والأحجام المذكورة أدناه هي تقديرات افتراضية — ويجب دائمًا التحقق من قاعدة بيانات نماذج الذكاء الاصطناعي أو تنفيذ الأمر ollama list لمعرفة أحدث ما هو متوفر على جهازك.
مرجع سريع
- التشغيل على أي جهاز كمبيوتر محمول (ذاكرة عشوائية 8 جيجابايت): لَامَا 3.2 بسعة 3 مليار معلّمة، وفاي-3 ميني، وجيما 3 بسعة 4 مليار معلّمة — صغيرة الحجم، سريعة، وتعمل دون اتصال بالإنترنت.
- الأفضل من حيث التوازن العام (16 جيجابايت): لَامَا 3.1 بسعة 8 مليار معلّمة، وكويين 2.5 بسعة 7 مليار معلّمة، وميسترال 7 مليار معلّمة — النقطة المثلى لمعظم المستخدمين.
- عالية الجودة (32 جيجابايت فأكثر / بطاقة رسوميات): جيمّا 2 بسعة 27 مليار معلّمة، وكيوين 2.5 بسعة 32 مليار معلّمة، وميكسترال 8×7 مليار معلّمة.
- قريبة من أحدث ما توصلت إليه التقنية (لأجهزة المحطات الطرفية / 48 غيغابايت فأكثر): لاما 3.3 بسعة 70 مليار معلّمة، وديب سيك-آر1 بسعة 70 مليار معلّمة.
- الاستدلال: ديب سيك-آر1 مستخلصة من نماذج أكبر. التشفير والبرمجة: كيوين 2.5 كودر، وكود لاما. الرؤية: إل-لافا. التضمينات: نوميك-إمبرد-تيكست.
- القاعدة: اختر النموذج حسب سعة الذاكرة المتاحة لديك — وجّه أي نموذج باستخدام أداتنا المجانية حاسبة ذاكرة VRAM.
- أشهر نماذج أولاما في لمحة واحدة
- كيفية عرض قائمة نماذج أولاما المُثبَّتة لديك
- كيفية البحث عن نماذج جديدة في المكتبة وتنزيلها
- النماذج الصغيرة — تعمل على أي جهاز لابتوب تقريبًا
- النماذج متوسطة الحجم — النقطة المثلى عند 16 غيغابايت
- النماذج الكبيرة — تناسب محطات العمل وبطاقات العرض الرسومية (GPU)
- النماذج المتخصصة: البرمجة، والرؤية الحاسوبية، وتضمينات النصوص (embeddings)
- أي نموذج من نماذج أولاما يجب أن تستخدمه فعليًّا؟
- تحقق مما إذا كان النموذج يتوافق مع نظامك قبل تنزيله
- الأسئلة الشائعة
- الخلاصة
أشهر نماذج أولاما في لمحة واحدة
كل نموذج مذكور أدناه متاح ببساطة عبر الأمر ollama pull «التنزيل» هو الحجم التقريبي الافتراضي للنموذج المكمّن بتقنية التكمين 4-بت (Q4)؛ أما «الحد الأدنى للذاكرة» فهو أقل سعة عملية مطلوبة من ذاكرة النظام (RAM) للوحدة المركزية (CPU) أو ذاكرة الوصول العشوائي للوحدة الرسومية (VRAM) لتشغيل النموذج بسلاسة. وعدد المُعَلَّمات (parameters) دقيقٌ، بينما الحجم تقريبي ويختلف مع كل إصدار.
| النموذج | عدد المُعَلَّمات | الحجم عند التنزيل (Q4) | الحد الأدنى للذاكرة | الأفضل لـ |
|---|---|---|---|---|
| لاما 3.2 | 1 مليار / 3 مليارات معلّمة | ~1.3 / 2 غيغابايت | 4–8 غيغابايت | للأجهزة الطرفية، والهواتف، والمحادثات الخفيفة جدًّا |
| لاما 3.1 | 8 مليار معلّمة | ~4.7 غيغابايت | 8–16 غيغابايت | أفضل نموذج صغير شامل الأداء |
| لاما 3.3 | 70 مليار معلّمة | حوالي 43 جيجابايت | 48 غيغابايت فأكثر | نموذج مفتوح قريب من أحدث ما توصلت إليه التقنية |
| جيما 3 | 1 مليار / 4 مليارات معلّمة | ~0.8 / 3.3 غيغابايت | 4–8 غيغابايت | نموذج صغير فعّال (من شركة جوجل) |
| جيما 2 | 9 مليارات / 27 مليار معلّمة | ~5.4 / 16 غيغابايت | 12–32 غيغابايت | أداء قوي نسبيًّا إلى حجمه |
| كيوين 2.5 | 0.5 مليار–72 مليار معلّمة | ~0.4–47 غيغابايت | 4 غيغابايت فأكثر | متعدد اللغات، ومدى واسع من السعات |
| كيوين 2.5 كودر | 1.5 مليار–32 مليار معلّمة | ~1–20 غيغابايت | 8 جيجابايت فأكثر | مساعد برمجة محلي |
| ميسترال | 7 مليار معلّمة | ~4.1 غيغابايت | 8 غيغابايت | نموذج كلاسيكي سريع وموثوق |
| ميسترال نيمو | 12 مليار معلّمة | ~7 غيغابايت | 16 غيغابايت | سياق طويل بطول 128 ألف رمز |
| ميكسترال | 8×7 مليار معلَّمة | حوالي 26 جيجابايت | 32 جيجابايت فأكثر | جودة نموذج المزيج من الخبراء (MoE) |
| فاي-4 | 14 مليار معلّمة | حوالي 9 جيجابايت | 16 غيغابايت | الاستدلال باستخدام نموذج صغير الحجم |
| فاي-3 ميني | 3.8 مليار معلَّمة | حوالي 2.3 جيجابايت | 8 غيغابايت | صغير الحجم لكنه قادرٌ على الأداء الجيد |
| ديب سيك-آر1 (مُستخلَص) | من 1.5 مليار إلى 70 مليار معلَّمة | حوالي 1.1–43 جيجابايت | 8 جيجابايت فأكثر | الاستدلال خطوةً بخطوة |
| إللاڤا | من 7 مليار إلى 34 مليار معلَّمة | حوالي 4.7–20 جيجابايت | 8 جيجابايت فأكثر | الرؤية (فهم الصور) |
| nomic-embed-text | — | حوالي 0.3 جيجابايت | 2 جيجابايت | المتجهات التضمينية لتطبيقات الاسترجاع المعزَّز بالذكاء الاصطناعي (RAG) والبحث |
هل ترغب في مقارنة هذه النماذج المحلية مع النماذج السحابية من حيث السعر والسرعة؟ إن قائمة قاعدة بيانات نماذج الذكاء الاصطناعي تعرض النماذج المفتوحة والمغلقة جنبًا إلى جنب، بينما توضح قائمة حاسبة تكلفة واجهة برمجة تطبيقات الذكاء الاصطناعي الحالات التي يكون فيها التشغيل المحلي أسرع وأوفر من الدفع مقابل كل رمز (token).
كيفية عرض قائمة نماذج أولاما المُثبَّتة لديك
لعرض جميع النماذج الموجودة بالفعل على جهازك، مع حجم كلٍّ منها ووقت آخر استخدامٍ لها، نفِّذ الأمر التالي:
ollama list
ويُظهر هذا الأمر اسم كل نموذج ووسمه (Tag) ومعرفه الفريد وحجمه. وللتحقق مما هو محمل حاليًّا في الذاكرة، استخدم الأمر ollama ps؛ ولإزالة نموذجٍ لا تحتاجه بعد الآن واستعادة المساحة التخزينية على القرص، استخدم الأمر ollama rm <الاسم>وهذه الأوامر الثلاثة — list, ps و rm — هي كل ما تحتاجه لإدارة مجموعة النماذج المحلية لديك.
كيفية البحث عن نماذج جديدة في المكتبة وتنزيلها
يوجد الكتالوج الكامل لبرنامج أولاما في مكتبتِه الإلكترونية، ويمكن تنزيل أي نموذجٍ منه عبر أمرٍ واحد فقط:
ollama pull llama3.1 أو تشغيله مباشرةً باستخدام الأمر ollama run llama3.1
تستخدم أسماء النماذج الأوسام (Tags) للدلالة على الحجم والنسخة — مثل llama3.1:8b, gemma2:27b, qwen2.5:14bوإذا لم تُحدِّد الوسم، فسيقوم أولاما تلقائيًّا بتنزيل الإصدار الافتراضي المناسب (عادةً ما يكون الإصدار الأكثر شيوعًا بتمثيل 4 بت). أما بالنسبة للتثبيت الأولي، فإن دليلنا التفصيلي لتثبيت أولاما خطوة بخطوة يشمل أنظمة ماك وويندوز ولينكس.
النماذج الصغيرة — تعمل على أي جهاز لابتوب تقريبًا
يمكن تشغيل النماذج التي تتراوح معلماتها بين مليار ومليارَيْن ونصف المليار بسلاسة على حاسوب محمول حديث يحتوي على 8 جيجابايت من الذاكرة العشوائية (RAM)، دون الحاجة إلى وحدة معالجة رسومية (GPU). لَامَا 3.2 بسعة 3 مليار معلّمة, جيما 3 بسعة 4 مليار معلّمة و فاي-3 ميني هي النماذج البارزة: سريعة جدًّا، ومفيدة حقًّا في مهام التلخيص وكتابة المسودات والإجابة عن الأسئلة البسيطة، وصغيرة بما يكفي للبقاء محملة باستمرار. وهي لن تُطابق أداء النماذج السحابية الرائدة، لكنها ممتازة للمهام اليومية الخاصة والمعزولة عن الشبكة، وهي نقطة البداية المثلى لمن يبدأ رحلته مع الذكاء الاصطناعي المحلي.
النماذج متوسطة الحجم — النقطة المثلى عند 16 غيغابايت
أما فئة النماذج ذات المعلمات بين 7 و14 مليار فهي الفئة الأنسب لمعظم المستخدمين. لَامَا 3.1 بسعة 8 مليار معلّمة, كويين 2.5 بسعة 7 مليار معلّمة و ميسترال 7 مليار معلّمة توفر قفزة كبيرة في اتساق النتائج مقارنةً بالنماذج الصغيرة، مع بقائها ضمن حدود مريحة من سعة الذاكرة العشوائية البالغة 16 جيجابايت أو وحدة معالجة رسومية شائعة الاستخدام. فاي-4 و ميسترال نيمو تدفع الجودة وطول السياق إلى مستويات أعلى. فإذا كنت تبحث عن نموذجٍ واحدٍ للاستخدام العام، فاختر أحد النماذج من هذه الفئة، فهي توفر أفضل توازنٍ بين القدرات المطلوبة والمتطلبات المادية.
النماذج الكبيرة — تناسب محطات العمل وبطاقات العرض الرسومية (GPU)
أما بدءًا من حجم 27 مليار معلَّمة فتصبح المتطلبات المادية جادةً جدًّا. جيما 2 بحجم 27 مليار معلَّمة و كويين 2.5 بسعة 32 مليار معلّمة تتطلب 32 جيجابايت أو أكثر من الذاكرة؛ ميكسترال 8×7 مليار معلَّمة ونماذج فئة الـ70 مليار معلَّمة — مثل لَامَا 3.3 بسعة 70 مليار معلّمة والـ ديب سيك-آر1 بحجم 70 مليار معلَّمة المستخلصة — تتطلب 48 جيجابايت فأكثر من الذاكرة السريعة، ما يعني عمليًّا ضرورة وجود وحدة معالجة رسومية عالية السعة التخزينية (VRAM) أو حاسوب ماك مزوَّد بشريحة أبل سيليكون عالية السعة. والمكافأة هنا هي جودة تقترب من جودة أكبر النماذج السحابية، مع تشغيلها كليًّا على جهازك الخاص. راجع دليلنا أفضل وحدات معالجة الرسومات (GPUs) للذكاء الاصطناعي لمعرفة ما الذي يمكنه تشغيل هذه النماذج فعليًّا.
النماذج المتخصصة: البرمجة، والرؤية الحاسوبية، وتضمينات النصوص (embeddings)
وبعيدًا عن المحادثة العامة، يستضيف أولاما نماذجًا متخصصة في مهام معينة. كيوين 2.5 كودر و كود لاما مبنية خصيصًا لمهام البرمجة، وتتكامل بشكل ممتاز مع أدوات بيئات التطوير المتكاملة (IDE) المحلية. إللاڤا يُضيف القدرة على الرؤية، بحيث يمكن للنموذج وصف الصور أو الاستدلال حولها. أما نماذج التضمين مثل nomic-embed-text و mxbai-embed-large فلا تدعم المحادثة إطلاقًا — بل تقوم بتحويل النصوص إلى متجهات تُستخدم في عمليات البحث والتوليد المعزَّز بالاسترجاع (RAG)، وهي العمود الفقري لأي إعداد محلي لـ RAG.
أي نموذج من نماذج أولاما يجب أن تستخدمه فعليًّا؟
الإجابة الصادقة هي: أكبر نموذج يمكن لذاكرتك استيعابه ضمن الفئة التي تحتاجها. فللاستخدام العام، ابدأ بنموذج بحجم 8 مليار معلَّمة (8B) وارتقِ إلى أحجام أكبر فقط إذا كانت الجودة لا تفي بالمتطلبات. وللمهام الاستدلالية، جرِّب نسخة DeepSeek-R1 المُبسَّطة (distill)؛ ولبرمجة الحاسوب، جرِّب Qwen 2.5 Coder؛ وللمهام المرتبطة بالصور، استخدم LLaVA. ونصنِّف أفضل الخيارات حسب حالة الاستخدام في أفضل نماذج الذكاء الاصطناعي اللغوي المحلي (LLM) التي يمكن تشغيلها على Ollama، ونقارن منصة Ollama نفسها مع البدائل المتاحة في أُولاما مقابل إم إل ستوديو مقابل vLLM مقابل llama.cpp.
تحقق مما إذا كان النموذج يتوافق مع نظامك قبل تنزيله
الخطأ الأكثر شيوعًا هو تنزيل نموذج كبير جدًّا بالنسبة لجهازك — فقد يرفض تحميله تمامًا أو يصبح أداءه بطيئًا جدًّا بسبب الاعتماد على التبديل إلى القرص الصلب (swapping to disk). لذا، قِّم حجم النموذج قبل التنزيل: كقاعدة تقريبية، يحتاج النموذج المؤهل بتقنية 4-bit إلى أقل بقليل من 1 غيغابايت من الذاكرة لكل مليار معلَّمة، بالإضافة إلى هامش احتياطي للسياق. وتقدِّم أداة مجانية منا حاسبة ذاكرة VRAM الرقم الدقيق المطلوب من الذاكرة لأي نموذج وأي مستوى تأهيل (quantisation)، كما أن متطلبات نظام أُولاما توضِّح بالتفصيل المفاضلة بين استخدام ذاكرة الوصول العشوائي (RAM) وذاكرة وحدة معالجة الرسومات (VRAM).
الأسئلة الشائعة
كيف أعرض قائمة النماذج المثبتة في Ollama؟ تشغيل ollama list لعرض جميع النماذج المثبتة مع حجم كلٍّ منها، ollama ps لعرض النموذج المحمل حاليًّا فقط، و ollama rm <الاسم> لحذف نموذج معين.
ما أفضل نموذج لمنصة Ollama؟ لا يوجد نموذج واحد «الأفضل» بشكل مطلق — فالاختيار يعتمد على سعة الذاكرة المتاحة لديك. فنموذج Llama 3.1 بحجم 8 مليار معلَّمة (8B) هو الخيار الأمثل متعدد المهام لأجهزة الذاكرة السعة 16 غيغابايت؛ راجع قوائمنا المُرتَّبة للاطلاع على أفضل خيار حسب حالة الاستخدام.
كم عدد النماذج المتاحة في منصة Ollama؟ مئات النماذج، تشمل عائلات المحادثة والبرمجة والرؤية وتضمين النصوص، مع توافر أحجام مختلفة داخل كل عائلة. والجدول أعلاه يغطي النماذج التي يستخدمها معظم المستخدمين فعليًّا.
كم سعة الذاكرة العشوائية (RAM) المطلوبة لتشغيل نماذج Ollama؟ تحتاج إلى 8 غيغابايت لتشغيل النماذج الصغيرة (1–4 مليار معلَّمة)، و16 غيغابايت لتشغيل الفئة الشائعة الأحجام (7–8 مليار معلَّمة)، بينما تتطلب النماذج الأكبر (27 مليار معلَّمة فأكثر) 32 غيغابايت أو أكثر من الذاكرة العشوائية، أو وجود وحدة معالجة رسومات (GPU). ويمكنك التحقق من أي نموذج باستخدام حاسبة ذاكرة VRAM.
هل يمكنني تشغيل هذه النماذج دون اتصال بالإنترنت؟ نعم — فبمجرد تنزيل النموذج، يعمل كل نموذج من نماذج Ollama بالكامل على جهازك دون الحاجة إلى اتصال إنترنت، وهذه هي الفائدة الأساسية لاستخدام النماذج المحلية أصلًا.
الخلاصة
قائمة نماذج Ollama طويلة، لكن الاختيار سهل: حدِّد أولًا ما تحتاجه — محادثة عامة، أو استدلال، أو برمجة، أو معالجة صور، أو تضمين نصوص — ثم اختر أكبر نموذج ضمن تلك الفئة تستوعبه ذاكرتك. ابدأ بحجم صغير مثل نموذج 8 مليار معلَّمة (8B)، واستخدم ollama list لتسجيل ومتابعة ما قمت بتثبيته، واعتمد دائمًا على حاسبة ذاكرة VRAM قبل كل عملية تنزيل لكي لا تحمل نموذجًا لا يستطيع جهازك تشغيله أصلًا. ومن بعد ذلك، يصبح تشغيل نماذج ذكاء اصطناعي قوية وخصوصية تامة على جهازك المحلي مجرد أمر يتطلَّب بضع أوامر بسيطة.
أسماء النماذج وأحجامها وتوافرها تتغيَّر باستمرار؛ والأرقام المذكورة هي تقديرات تقريبية للقيم الافتراضية السارية اعتبارًا من منتصف عام 2026 — ويجب التحقق منها عبر ollama list والمكتبة الرسمية قبل الاعتماد عليها.
