مؤتمر Google I/O 2024 – كل شيء حول Gemini والذكاء الاصطناعي التوليدي

كان مؤتمر جوجل Google I/O 2024 بالأمس مُكتظًا بالإعلان عن ميزات الذكاء الاصطناعي وأحدث ما توصلت إليه الشركة في هذا المجال الذي سيُغير المستقبل. وبالفعل رصدنا معكم في موضوع سابق أبرز الميزات الذكية التي كشفت عنها جوجل، لكن هذا لم يكن كُل شيئ.
حيث كان لنموذج Gemini حضور قوي مع إصدارات جديدة منه ووصول متشعب له في عدة برامج ومشاريع مختلفة. أيًضا كشفت جوجل عن نماذج ذكاء اصطناعي توليدية جديدة، أبرزها نموذج لإنشاء الصور بالذكاء الاصطناعي، والآخر لإنشاء مقاطع الفيديو بالذكاء الاصطناعي. ولا ننس مشروع Astra بكل تأكيد.
تحديثات Gemini التي تم الكشف عنها في Google I/O 2024
بداية من بوت Gemini، فرأينا بالأمس إصدار موسع لنماذج مُتشعبة من بوت الذكاء الاصطناعي من جوجل. كان أبرزها Gemini 1.5 Pro المُطور، وGemini 1.5 Flash. ودمج Gemini في الهاتف الذكي وعدد من تطبيقات جوجل.
نموذج Gemini 1.5 Pro

مع الإصدار الجديد من Gemini 1.5 Pro أصبح بإمكان الذكاء الاصطناعي الآن تحليل المستندات وقواعد التعليمات البرمجية. ومقاطع الفيديو والتسجيلات الصوتية الأطول من ذي قبل.
وخلال مؤتمر Google I/O 2024 بالأمس، عرضت جوجل معاينة خاصة لإصدار جديد من Gemini 1.5 Pro، النموذج الرئيسي الحالي للشركة. وتم الكشف عن أنه يمكنه استيعاب ما يصل إلى 2 مليون رمز مميز.
وبهذا المستوى، يدعم الإصدار الجديد من Gemini 1.5 Pro مدخلات أكبر من أي نموذج ذكاء اصطناعي متاح حاليًا.
نموذج Gemini 1.5 Pro متاح الآن للمطورين ومُستخدمي الأعمال، من خلال Vertex AI وAI Studio من جوجل. لكنه سيصل للجميع في النهاية ويحل محل النموذج الحالي.
نموذج Gemini 1.5 Flash

بجانب Gemini 1.5 Pro، كشفت جوجل عن Gemin، كنموذج أخف وأسرع وأرخص من الذكاء الاصطناعي. مع قدرات مثل التلخيص والدردشة والتعليق على الصور والفيديو واستخراج البيانات من المُستندات.
ومع ذلك فإن نموذج Gemini 1.5 Flash ليس مُخصصًا للمُستخدمين العاديين، ولكنه مُوجّه للمُطورين. إذ يوفر طريقة أسرع وأقل تكلفةً للمطورين لبناء المنتجات والخدمات المُعتمدة على الذكاء الاصطناعي باستخدام تقنيات جوجل.
دمج Gemini في تطبيق جيميل
أعلنت جوجل كذلك خلال مؤتمرها بالأمس، دمج Gemini في تطبيق جيميل. حيث سيتمكن مستخدمو Gmail من البحث عن رسائل البريد الإلكتروني الخاصة بهم وتلخيصها وصياغتها باستخدام تقنية Gemini AI.
سيكون Gemini أيضًا قادرًا على اتخاذ إجراء بشأن رسائل البريد الإلكتروني للمهام الأكثر تعقيدًا. مثل مساعدتك في عملية إرجاع شيئ اشتريته عبر الإنترنت. بالبحث في صندوق الوارد الخاص بك، والعثور على الإيصال وملء نموذج عبر الإنترنت.
وقدمت جوجل خلال العرض التقديمي مثال لعملية إرجاع منتج معين قام المستخدم بشرائه. وتمت العملية بالكامل بالذكاء الاصطناعي دون تدخل من المستخدم.
دمج Gemini في خرائط جوجل
أعلنت جوجل عن دمج الذكاء لاصطناعي في خرائط جوجل للمطورين، بحيث سيقوم الذكاء الاصطناعي بكتابة وصف الأماكن والمعلومات حولها بنفسه. هذه الميزة متاحة حاليًا للمطورين.
نموذج Gemini Nano

كان من ضمن النماذج الجديدة التي قدمتها جوجل خلال مؤتمر Google I/O 2024، نموذج Gemini Nano. وهو أصغر نماذج الذكاء الاصطناعي التي تقدمها الشركة. حيث يعمل النموذج الجديد على جهاز المستخدم بشكل مستقل.
يعمل النموذج الجديد عبر جوجل كروم> وتقول الشركة إن هذا سيمكن المطورين من استخدام النموذج الموجود على الجهاز لتشغيل ميزات الذكاء الاصطناعي الخاصة بهم.
وتخطط Google لاستخدام هذه الإمكانية الجديدة لتشغيل ميزات مثل أداة “ساعدني في الكتابة” الموجودة من Workspace Lab في Gmail.
Google I/O 2024 – بوت Gemini سيحل محل مساعد جوجل
أعلنت جوجل أن Gemini سيكون قريبًا جزء من نظام التشغيل اندرويد، كبديل لمساعد جوجل الذكي الذي اعتمدت عليه الشركة لسنوات.
وسيتمكن المستخدمون من سحب وإسقاط الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي مباشرة في Gmail ورسائل جوجل والتطبيقات الأخرى. وفي الوقت نفسه، سيتمكن مستخدمو يوتيوب من النقر على “اسأل هذا الفيديو” للعثور على معلومات محددة من داخل مقطع الفيديو هذا على يوتيوب. وغيرها من الميزات الأكثر تطورًا وذكاءًا.
مشروع Project Astra – ميزة Gemini Live

في خطوة أكثر جرأة من جوجل، أعلنت الشركة عن مشروع Project Astra. الذي يأخذ تجربة الذكاء الاصطناعي لمحيطك الخارجي مع Gemini Live.
حيث استعرضت الشركة تجربة جديدة في Gemini تسمى Gemini Live. والتي تتيح للمستخدمين إجراء محادثات صوتية “متعمقة” مع Gemini على هواتفهم الذكية. أيضًا، سيستطيع المستخدمين مقاطعة Gemini أثناء حديثه لطرح أسئلة توضيحية. وسوف يتكيف البرنامج مع أنماط كلامهم في الوقت الفعلي. ويتفاعل معم بطريقة تُشبه التواصل البشري.
وليس هذا فحسب، بل سيستطيع الذكاء الاصطناعي الرؤية عبر كاميرا الهاتف، وتحليل ما يراه. وكمثال، عرضت جوجل مقطع فيديو لمستخدم وهي تسأل Gemini عن المكان التي توجد به، ويوضح لها اسم الحي والمنطقة التي تتواجد بها ويعرض معلومات عنها.
ترقيات الذكاء الاصطناعي التوليدي في Google I/O 2024
بجانب ترقيات Gemini التي ذكرناها في الأعلى، كان للذكاء الاصطناعي التوليدي نصيبًا في الترقيات خلال مؤتمر Google I/O 2024. حيث قدمت الشركة نموذج Imagen 3 وVeo.
نموذج Imagen 3

نموذج Imagen 3 هو النموذج الأحدث في عائلة نماذج توليد الصور بالذكاء الاصطناعي – Imagen Geneative AI التابعة لشركة التكنولوجيا العملاقة.
وقال ديميس هاسابيس، الرئيس التنفيذي لشركة DeepMind، قسم أبحاث الذكاء الاصطناعي في جوجل. أن Imagen 3 يفهم بدقة أكبر الأوامر النصية التي يحولها إلى صور مقارنة بسابقه، Imagen 2. وهو أكثر “إبداعًا وتفصيلاً”، بالإضافة إلى ذلك، فإن النموذج ينتج عددًا أقل من الأخطاء والتشتت.
نموذج Veo
يبدو أن جوجل تسعى للتفوق على نموذج Sora من OpenAI، مع نموذجها الجديد Veo. وهو نموذج ذكاء اصطناعي يمكنه إنشاء مقاطع فيديو بدقة 1080 بكسل مدتها دقيقة تقريبًا عن طريق الأوامر النصية.
يستطيع Veo التقاط أنماط بصرية وسينمائية مختلفة. بما في ذلك لقطات المناظر الطبيعية والفواصل الزمنية. وإجراء تعديلات وتعديلات على اللقطات التي تم إنشاؤها بالفعل.
كما أنه يعتمد على العمل التجاري الأولي لجوجل في مجال إنشاء الفيديو. والذي تمت معاينته في أبريل. واستفاد من عائلة Imagen 2 الخاصة بالشركة من نماذج توليد الصور لإنشاء مقاطع فيديو متكررة.
ترقية كبيرة على ميزة Circle to Search
أخيرًا، فقد أعلنت جوجل عن ترقيات كبيرة لميزتها الشهيرة Circle to Search، التي تُمكن المستخدمين من البحث عن أي شيئ بمجرد وضع دائرة عليه. حيث أصبحت تدعم الآن مقاطع الفيديو وليس فقط الصور.
كذلك أصبحت الأن يُمكنها حل المشكلات الأكثر تعقيدًا مثل المسائل الرياضية والمعادلات.
وبهذا نكون قد غطينا معكم أبرز النقاط التي دار حولها مؤتمر جوجل Google I/O 2024، في موضوعين منفصلين. هذا الموضوع وموضوع سابق يُمكنكم الاطّلاع عليه من هُنا.