الذكاء الاصطناعي المدمَج

Kenji Baheux
Kenji Baheux
Alexandra Klepper
Alexandra Klepper

عندما ننشئ ميزات باستخدام نماذج الذكاء الاصطناعي (AI) على الويب، غالبًا ما نعتمد على الحلول من جهة الخادم لنماذج أكبر. وينطبق ذلك بشكل خاص على الذكاء الاصطناعي التوليدي، الذي يزيد فيه حجم النماذج الأصغر بمقدار ألف مرة عن متوسط حجم صفحة الويب. ينطبق ذلك أيضًا على حالات استخدام الذكاء الاصطناعي الأخرى، التي تتراوح فيها النماذج بين 10 ثوانٍ و100 ميغابايت.

وبما أنّ هذه النماذج لا تتم مشاركتها على المواقع الإلكترونية، يجب على كل موقع إلكتروني تنزيلها عند تحميل الصفحة. هذا حل غير عملي للمطورين والمستخدمين

على الرغم من أنّ الذكاء الاصطناعي من جهة الخادم هو خيار رائع للنماذج الكبيرة، فإنّ الطُرق على الجهاز والنهج المختلط لها جوانب إيجابية خاصة بها. ولجعل هذه المناهج قابلة للتطبيق، نحتاج إلى التعامل مع حجم النموذج وتقديم النموذج.

لهذا السبب، نعمل على تطوير واجهات برمجة تطبيقات لمنصات الويب وميزات خاصة بالمتصفّح مصمَّمة لدمج نماذج الذكاء الاصطناعي (AI) مباشرةً في المتصفّح، بما في ذلك النماذج اللغوية الكبيرة (LLM). ويشمل ذلك Gemini Nano، وهو النسخة الأكثر فعالية من مجموعة Gemini من النماذج اللغوية الكبيرة، وهي مصمّمة للتشغيل محليًا على أحدث أجهزة الكمبيوتر المكتبي والكمبيوتر المحمول. من خلال الذكاء الاصطناعي المدمَج، يمكن لموقعك الإلكتروني أو تطبيق الويب الخاص بك تنفيذ مهام مستندة إلى الذكاء الاصطناعي (AI) بدون الحاجة إلى نشر أو إدارة نماذج الذكاء الاصطناعي الخاصة به.

تعرَّف على مزايا الذكاء الاصطناعي المدمَج وخطة التنفيذ وكيفية الاستفادة من هذه التكنولوجيا.

معاينة المنتج قبل إطلاقه

ونحتاج إلى ملاحظاتك وآرائك لتصميم واجهات برمجة التطبيقات، والتأكُّد من استيفائها حالات الاستخدام، ومناقشة مناقشاتنا مع موردي المتصفّحات الآخرين من أجل توحيد المقاييس.

يمكنك الانضمام إلى برنامج المعاينة الأولية لتقديم ملاحظاتك حول أفكار الذكاء الاصطناعي المضمَّنة في مراحلها الأولى، واستكشاف فرص اختبار واجهات برمجة التطبيقات الحالية من خلال إنشاء نماذج أولية محلية.

انضم إلى مجموعة الإشعارات العلنية لمطوّري الذكاء الاصطناعي في Chrome ليتم إعلامك عند توفُّر واجهات برمجة تطبيقات جديدة.

مزايا الذكاء الاصطناعي المدمَج لمطوّري البرامج على الويب

من خلال تقنية الذكاء الاصطناعي المدمَجة، يمكن أن يوفِّر المتصفِّح الأساس والنماذج الخبيرة ويديرها.

مقارنةً بالذكاء الاصطناعي على الجهاز فقط، يقدّم الذكاء الاصطناعي المدمَج المزايا التالية:

  • سهولة النشر: أثناء توزيع المتصفّح للنماذج، يأخذ في الاعتبار إمكانات الجهاز ويدير تحديثات النموذج. يعني ذلك أنّك لست مسئولاً عن تنزيل النماذج الكبيرة أو تحديثها عبر شبكة. لن تحتاج إلى حل المشاكل المتعلقة بإخلاء مساحة التخزين وميزانية الذاكرة في وقت التشغيل وتكاليف العرض وغيرها من التحديات.
  • الوصول إلى ميزة تسريع الأجهزة: تم تحسين بيئة تشغيل الذكاء الاصطناعي في المتصفّح للاستفادة إلى أقصى حد من الأجهزة المتاحة، سواء كانت وحدة معالجة رسومات أو وحدة NPU أو استخدام وحدة المعالجة المركزية (CPU). وبالتالي يمكن لتطبيقك الحصول على أفضل أداء على كل جهاز.

مزايا التشغيل على الجهاز

مع استخدام نهج الذكاء الاصطناعي المدمَج، أصبح من السهل تنفيذ مهام الذكاء الاصطناعي على الجهاز، ما يوفّر بدوره الجوانب الإيجابية التالية:

  • المعالجة المحلية للبيانات الحسّاسة: يمكن للذكاء الاصطناعي على الجهاز فقط تحسين قصة خصوصيتك. على سبيل المثال، إذا كنت تستخدم بيانات حسّاسة، يمكنك توفير ميزات تستخدم الذكاء الاصطناعي للمستخدمين مع التشفير التام بين الأطراف.
  • تجربة مستخدم سريعة: في بعض الحالات، يعني الاستغناء عن رحلات الذهاب والعودة إلى الخادم أنّه يمكنك تقديم نتائج شبه فورية. يمكن أن يمثّل الذكاء الاصطناعي على الجهاز فقط الفرق بين ميزة قابلة للتطبيق وتجربة مستخدم دون المستوى الأمثل.
  • وصول أكبر إلى الذكاء الاصطناعي: يمكن لأجهزة المستخدمين تحميل جزء من عبء المعالجة مقابل الحصول على المزيد من إمكانية الوصول إلى الميزات. على سبيل المثال، إذا كنت توفّر ميزات الذكاء الاصطناعي المدفوعة، يمكنك معاينة هذه الميزات باستخدام الذكاء الاصطناعي على الجهاز حتى يتمكّن العملاء المحتملون من الاطّلاع على مزايا منتجك بدون تكلفة إضافية عليك. يمكن أن يساعدك هذا النهج المختلط أيضًا في إدارة تكاليف الاستنتاج خاصةً في تدفقات المستخدمين الشائعة.
  • استخدام الذكاء الاصطناعي بلا إنترنت: يمكن للمستخدمين الوصول إلى ميزات الذكاء الاصطناعي (AI) حتى في حال عدم وجود اتصال بالإنترنت. وهذا يعني أنّ المواقع الإلكترونية وتطبيقات الويب يمكن أن تعمل على النحو المتوقَّع بلا اتصال بالإنترنت أو مع إمكانية اتصال متنوع.

الذكاء الاصطناعي المختلط: على الجهاز ومن جهة الخادم

على الرغم من أنّ الذكاء الاصطناعي في الجهاز يمكنه التعامل مع مجموعة كبيرة من حالات الاستخدام، هناك بعض حالات الاستخدام التي تتطلّب دعمًا من جهة الخادم.

على سبيل المثال، قد تحتاج إلى استخدام طُرز أكبر أو دعم مجموعة أكبر من المنصات والأجهزة.

يمكنك استخدام مناهج مختلطة، استنادًا إلى ما يلي:

  • التعقيد: من الأسهل دعم حالات استخدام محدّدة وسهلة الاستخدام من خلال الذكاء الاصطناعي على الجهاز فقط. وبالنسبة إلى حالات الاستخدام المعقّدة، ننصحك بالتنفيذ من جهة الخادم.
  • المرونة: يمكنك استخدام الميزة من جهة الخادم تلقائيًا واستخدامها على الجهاز عندما يكون الجهاز غير متصل بالإنترنت أو متصلًا بالإنترنت.
  • الأسلوب الاحتياطي السلس: سيستغرق استخدام المتصفّحات المزوّدة بتكنولوجيا الذكاء الاصطناعي (AI) بعض الوقت، وقد لا تتوفّر بعض الطُرز، وقد لا تستوفي الأجهزة القديمة أو الأقل قوة متطلبات الأجهزة لتشغيل جميع الطُرز على النحو الأمثل. توفير الذكاء الاصطناعي من جهة الخادم لهؤلاء المستخدمين

بالنسبة إلى نماذج Gemini، يمكنك استخدام ميزة الدمج في الخلفية (باستخدام Python أو Go أو Node.js أو REST) أو تنفيذها في تطبيق الويب باستخدام حزمة تطوير البرامج (SDK) الجديدة الخاصة بالذكاء الاصطناعي من Google للويب.

بنية المتصفح وواجهات برمجة التطبيقات

لدعم الذكاء الاصطناعي المدمَج في Chrome، أنشأنا بنية أساسية يمكن من خلالها الوصول إلى نماذج أساسية ونموذجية مختصة بالتنفيذ على الجهاز فقط. تدعم هذه البنية الأساسية حاليًا ميزات مبتكرة في المتصفِّح، مثل مساعدة في الكتابة، وستتوفّر قريبًا واجهات برمجة تطبيقات مخصّصة للذكاء الاصطناعي على الجهاز فقط.

يمكنك بشكل أساسي الوصول إلى إمكانات الذكاء الاصطناعي المضمَّنة باستخدام واجهات برمجة التطبيقات للمهام، مثل واجهة برمجة تطبيقات الترجمة أو واجهة برمجة تطبيقات للتلخيص. تم تصميم واجهات برمجة تطبيقات المهام لتنفيذ الاستنتاج وفقًا لأفضل نموذج للمهمة.

في Chrome، تم تصميم واجهات برمجة التطبيقات هذه للاستنتاج من Gemini Nano من خلال الضبط الدقيق أو بنموذج خبراء. تم تصميم Gemini Nano للتشغيل محليًا على معظم الأجهزة الحديثة، وهو الخيار الأفضل لحالات الاستخدام المتعلقة باللغة، مثل التلخيص أو إعادة الصياغة أو التصنيف.

نعتزم أيضًا توفير واجهات برمجة تطبيقات استكشافية كي تتمكن من تجربة التطبيقات محليًا ومشاركة حالات استخدام إضافية.

على سبيل المثال، قد نقدّم ما يلي:

  • واجهة برمجة تطبيقات الطلب: يمكنك إرسال مهمة عشوائية، يتم التعبير عنها بلغة طبيعية، إلى النموذج اللغوي الكبير المضمَّن (Gemini Nano في Chrome).
  • واجهة برمجة تطبيقات التوليف الدقيق (LoRA): يمكنك تحسين أداء النموذج اللغوي الكبير المضمَّن في مَهمّة من خلال ضبط ترجيحات النموذج من خلال الضبط الدقيق للتكيف منخفض الترتيب.
يوضِّح هذا المخطّط البياني كيف يمكن لموقعك الإلكتروني أو تطبيقك استخدام واجهات برمجة التطبيقات للمهام ومنصات الويب الاستكشافية للوصول إلى النماذج المضمّنة في Chrome.

حالات استخدام ميزات الذكاء الاصطناعي المدمَجة

في ما يلي بعض الطرق التي يمكن أن تستفيد بها أنت والمستخدمين في مؤسستك من الذكاء الاصطناعي المدمَج:

  • استخدام المحتوى المحسَّن باستخدام الذكاء الاصطناعي (AI): بما في ذلك التلخيص والترجمة والإجابة عن أسئلة حول بعض المحتوى وتصنيفه وتصنيفه.
  • إنشاء المحتوى المستند إلى الذكاء الاصطناعي: مثل المساعدة في الكتابة والتدقيق اللغوي وتصحيح الأخطاء النحوية وإعادة الصياغة

الخطوات التالية

يمكنك الانضمام إلى برنامج المعاينة المبكرة لتجربة واجهات برمجة تطبيقات الذكاء الاصطناعي المدمجة في مراحلها الأولى.

في هذه الأثناء، يمكنك التعرّف على كيفية استخدام Gemini Pro على خوادم Google مع مواقعك الإلكترونية وتطبيقاتك من خلال البدء السريع لاستخدام Gemini Pro لإنشاء JavaScript.