ChatGPT يحصل على أقوى نموذج توليد صور بالذكاء الاصطناعي مع GPT-4o

تفتخر OpenAI بنموذج GPT-4o المتطور الذي أطلقته منذ عام تقريبًا، والآن خضع النموذج للتحسينات وإضافة ميزات جديدة. أحدثها هو توليد الصور – حيث يمكن لنموذج الذكاء الاصطناعي توليد صور عالية الجودة ومفصلة. ويمكنه اتباع تعليمات لغتك الطبيعية لتعديلها حتى تحصل على الصورة التي تخيلتها تمامًا.
وهذه الميزات المتطورة أصبحت متاحة الآن بشكل مدمج في بوت ChatGPT ليتمتع البوت بقدرات توليد صور أفضل من أي وقت سبق.
وفقًا لموقع PCMAG، وتشيد OpenAI بمهارة GPT-4o في “عرض النصوص بدقة، واتباع المطالبات بدقة. والاستفادة من قاعدة المعرفة الأساسية لـ 4o وسياق الدردشة. بما في ذلك تحويل الصور المُحمّلة أو استخدامها كمصدر إلهام بصري”. ما ينتج عنه صورًا أكثر تناسقًا من اي وقت مضى.
وتضيف الشركة: تم تحقيق هذا التوازن من خلال تدريب النماذج على “التوزيع المشترك للصور والنصوص على الإنترنت. وتعلم ليس فقط كيفية ارتباط الصور باللغة، بل كيفية ارتباطها ببعضها البعض”

في السابق، كان بوت ChatGPT يعتمد على نموذج DALL-E لتوليد الصور، لكنه لم يُعطِ نتائج متسقة دائمًا وكان هناك العديد من الأخطاء. لكن مع GPT-4o أصبحت نتائج توليد الصور فائقة الدقة.
حيث يستطيع GPT-4o التعامل مع عدد ضخم من العناصر داخل الصورة. وفي الوقت الذي لا تستطيع نماذج توليد الصور التعامل مع أكثر من ثمانية عناصر للصورة. يستطيع GPT-4o التعالم مع ما يصل إلى 20 عنصر وتفصيلة في الصورة الواحدة.
ومع ذلك، تحذّر OpenAI قائلةً: “نموذجنا ليس مثاليًا. نحن نُدرك وجود العديد من القيود في الوقت الحالي، والتي سنعمل على معالجتها من خلال تحسينات النموذج بعد الإطلاق الأولي”.
أخيرًا، ، ستتوفر ميزة إنشاء الصور المدعومة بنموذج GPT-4o في ChatGPT لجميع مستخدمي اشتراكات Plus وPro وTeam وFree، مع دعم لعملاء Enterprise وEdu قريبًا. كما ستتوفر الميزة أيضًا ضمن أداة إنشاء الفيديو Sora.