الاخبارتطبيقات وبرامج

آبل تُطلق نموذج ذكاء اصطناعي لتعديل الصور بالأوامر المكتوبة!

كشفت شركة آبل مؤخرًا عن نموذج ذكاء اصطناعي خاصة بها يحمل اسم MGIE، الذي يُمكنه تعديل الصور بالذكاء الاصطناعي بناءًا على الأوامر النصية المكتوبة.

النموذج الجديد من آبل يعتمد على نموذج اللغة الكبير متعدد الوسائط (MLLMs) لتفسير الأوامر المستندة إلى النص عند معالجة الصور. حيث يُمكن للأداة الجديدة تعديل الصور بناءًا على أوامرك التي تكتبها.

ما الجديدة في نموذج تعديل الصور بالذكاء الاصطناعي من آبل؟

بالفعل يوجد عدد مماثل من تلك الأدوات التي عدل الصور بالذكاء الاصطناعي بناءًا على الأوامر النصية، إلا أن “التعليمات البشرية تكون في بعض الأحيان مختصرة جدًا بحيث لا يمكن للطرق الحالية التقاطها ومتابعتها”.

في حين أن نموذج آبل الجديد يعتمد على نموذج لغة أكبر وأكثر تطورًا مع القدرة على تفسير الأوامر الغير واضحة والمختصرة.

قامت الشركة بتطوير MGIE مع باحثين من جامعة كاليفورنيا، سانتا باربرا. ويتمتع MLLMs بالقدرة على تحويل المطالبات النصية البسيطة أو الغامضة إلى تعليمات أكثر تفصيلًا ووضوحًا يمكن لمحرر الصور نفسه اتباعها.

على سبيل المثال، إذا أراد المستخدم تعديل صورة بيتزا بيبروني “لجعلها أكثر صحية”، يمكن أن يفسرها MLLMs على أنها “إضافة طبقة نباتية” وتحرير الصورة على هذا النحو.

بالإضافة إلى التعديل على الصورة، يُمكن لـ MGIE أيضًا قص الصور وتغيير حجمها وتدويرها، بالإضافة إلى تحسين السطوع والتباين وتوازن الألوان، كل ذلك من خلال الأوامر النصية فقط.

كذلك يُمكنه تعديل مناطق معينة من الصورة ويمكنه، على سبيل المثال، تعديل شعر وعينين وملابس الشخص الموجود بالصورة، أو إزالة العناصر الموجودة في الخلفية.

وفقًا لـ VentureBeat، أطلقت آبل نموذج تعديل الصور بالذكاء الاصطناعي MGIE على GitHub، ولكن يمكن للمهتمين أيضًا تجربة العرض التوضيحي الذي يتم استضافته حاليًا على Hugging Face Spaces.

أخيرًا، فلم توضح شركة آبل بعد ما إذا كانت تخطط لاستخدام هذا المشروع في أداة أو ميزة يمكنها دمجها في أي من منتجاتها الحالية أو القادمة.

زر الذهاب إلى الأعلى