نماذج Gemma المفتوحة
مجموعة من النماذج الخفيفة والعصرية المفتوحة التي تم إنشاؤها من الأبحاث والتكنولوجيا نفسها المستخدمة في إنشاء نماذج Gemini
نقدّم لك
Gemma 2
تمت إعادة تصميم Gemma 2 للحصول على أداء فائق وكفاءة لا مثيل لها، وذلك لتوفير استنتاج فائق السرعة على أجهزة متنوعة.
5 لقطات
MMLU
معيار MMLU هو اختبار يقيس اتساع المعرفة والقدرة على حل المشكلات التي تكتسبها النماذج اللغوية الكبيرة أثناء التدريب المسبق.
25 لقطة
ARC-C
معيار ARC-c هو مجموعة فرعية أكثر تركيزًا من مجموعة بيانات ARC-e، ولا يحتوي إلا على الأسئلة التي تمت الإجابة عنها بشكل غير صحيح من خلال الخوارزميات الشائعة (قاعدة استرجاعية وظهور الكلمات).
5 لقطات
بروتوكول GSM8K
يختبر معيار GSM8K قدرة النموذج اللغوي على حل المسائل الرياضية في مرحلة التعليم المدرسي والتي غالبًا ما تتطلب خطوات متعددة من الاستنتاج.
3-5 لقطات
AGIEval
يختبر مقياس أداء AGIEval الذكاء العام لنموذج لغوي من خلال أسئلة مشتقة من اختبارات حقيقية مصممة لتقييم القدرات الفكرية البشرية.
3-shot، CoT
BBH
ويركز معيار BBH (BIG-Bench Hard) على المهام التي تفوق قدرات النماذج اللغوية الحالية، واختبار حدودها عبر مختلف مجالات الاستنتاج والفهم.
لقطة 3، F1
الانبطاح
DROP هو مقياس لفهم القراءة ويتطلب استنتاجًا منفصلاً على الفقرات.
5 لقطات
Winogrande
يختبر مقياس أداء Winogrande قدرة النموذج اللغوي على حل مهام ملء الفراغات الغامضة باستخدام الخيارات الثنائية، ما يتطلب استدلالًا منطقيًا عامًا.
10 لقطات
HellaSwag
يتحدى مقياس HellaSwag قدرة النموذج اللغوي على فهم وتطبيق المنطق السليم من خلال اختيار النهاية الأكثر منطقية للقصة.
4 لقطات
MATH
يقيّم MATH قدرة النموذج اللغوي على حل المسائل الكلامية الرياضية المعقدة، والتي تتطلب الاستنتاج وحل المشاكل متعدد الخطوات وفهم المفاهيم الرياضية.
0-لقطة
ARC-e
يختبر معيار ARC-e المهارات المتقدّمة للإجابة عن الأسئلة في النموذج اللغوي مع أسئلة علمية حقيقية من فئة خيارات متعددة على مستوى المدرسة الابتدائية.
0-لقطة
PIQA
يختبر مقياس أداء PIQA قدرة النموذج اللغوي على فهم المنطق السليم وتطبيقه من خلال الإجابة عن أسئلة حول التفاعلات الجسدية اليومية.
0-لقطة
SIQA
يقيّم معيار SIQA مدى فهم النموذج اللغوي للتفاعلات الاجتماعية والحس السليم الاجتماعي من خلال طرح أسئلة حول تصرفات الأشخاص وآثارها الاجتماعية.
0-لقطة
منطقية
يختبر مقياس أداء BoolQ قدرة النموذج اللغوي على الإجابة عن أسئلة نعم/لا تحدث بشكل طبيعي، كما يختبر قدرة النماذج على تنفيذ مهام استنتاج اللغة الطبيعية على أرض الواقع.
5 لقطات
TriviaQA
يختبر مقياس أداء TriviaQA مهارات فهم القراءة من خلال ثلاثة أضعاف الأدلة والأدلة على الأسئلة.
5 لقطات
NQ
يختبر مقياس قياس الأداء (NQ) قدرة النموذج اللغوي على إيجاد الإجابات وفهمها في مقالات ويكيبيديا كاملة، من خلال محاكاة سيناريوهات الإجابة على الأسئلة الواقعية.
Pass@1
HumanEval
يختبر معيار HumanEval قدرات إنشاء الرموز البرمجية في نموذج لغوي من خلال تقييم ما إذا كانت حلوله تجتاز اختبارات الوحدة الوظيفية لمشكلات البرمجة.
3 لقطات
MBPP
يختبر معيار MBPP قدرة النموذج اللغوي على حل المشكلات الأساسية لبرمجة بايثون، مع التركيز على مفاهيم البرمجة الأساسية والاستخدام القياسي للمكتبة.
100%
75%
50%
25%
0%
100%
75%
50%
25%
0%
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
اللاما 3
8 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
جيما 1
2.5 مليار
جيما 2
2.6 مليار
Mistral
7 مليار
جيما 1
7 مليار
جيما 2
9 مليار
جيما 2
27 مليار
*في ما يلي مقاييس الأداء للنماذج المدرَّبة مسبقًا. يُرجى الاطّلاع على التقرير الفني للحصول على تفاصيل عن الأداء باستخدام أساليب أخرى.
مجموعة نماذج Gemma
أدلة البدء السريع للمطوّرين
أدلة البدء السريع للشركاء
كتاب الطبخ الخاص بجيما
تعرَّف على مجموعة من الوصفات العملية والأمثلة التي تعرض مدى فعالية "جيما" وتنوّعها في مهام مثل إضافة شرح للصور باستخدام PaliGemma، وإنشاء الرموز البرمجية باستخدام CodeGemma، وإنشاء روبوتات دردشة مع نماذج Gemma المُحسَّنة.
التطوير المسؤول للذكاء الاصطناعي
المسئولية حسب التصميم
تم تدريب التطبيق مسبقًا على البيانات المنظّمة بعناية وتم ضبطهما للحفاظ على السلامة.
تقييم قوي وشفاف
تكشف التقييمات الشاملة وإعداد التقارير الشفافة عن قيود النموذج لاعتماد نهج مسؤول لكل حالة استخدام.
تعزيز التطوير المسؤول
تساعد مجموعة أدوات الذكاء الاصطناعي التوليدي المسؤول المطوّرين على تصميم وتنفيذ أفضل ممارسات الذكاء الاصطناعي بشكل مسؤول.
محسَّنة لخدمة Google Cloud
باستخدام نماذج Gemma المتوفّرة في Google Cloud، يمكنك تخصيص النموذج بشكلٍ كبير وفقًا لاحتياجاتك المحددة باستخدام أدوات Vertex AI المُدارة بالكامل أو خيار GKE المُدار ذاتيًا ونشره في بنية أساسية مرنة ومنخفضة التكلفة ومحسّنة باستخدام الذكاء الاصطناعي.
تسريع الأبحاث الأكاديمية باستخدام أرصدة Google Cloud
يمكنك تحسين مستوى أبحاثك باستخدام نماذج Gemma 2 في Google Cloud. ستعمل هذه الموجة الجديدة من النماذج المفتوحة على توسيع نطاق دعمنا لأحدث الأبحاث. يمكنك تقديم طلب الآن للحصول على أرصدة Google Cloud لتحسين أبحاثك والمساهمة في تطوير المجتمع العلمي.
انضم إلى المنتدى
يمكنك التواصل مع الآخرين في مجتمع نماذج تعلُّم الآلة وتصفّحها ومشاركتها.