جوجل تطلق نموذج “Imagen 4” لتوليد الصور: تحسينات ملحوظة ومنافسة محتدمة

أعلنت شركة جوجل رسميًا عن إطلاق نموذج الذكاء الاصطناعي الجديد Imagen 4، وهو أحدث إصدار من سلسلة نماذج توليد الصور عبر النصوص التي تطورها الشركة. ويأتي هذا الإصدار الجديد في إطار سعي جوجل لتعزيز حضورها في مجال الذكاء الاصطناعي المرئي، وسط منافسة متصاعدة من نماذج مثل DALL·E 3 من OpenAI وMidjourney 7.
تحسين عرض النصوص ودقة التفاصيل
بحسب ما كشفت عنه الشركة، فإن Imagen 4 يتميز بتحسن واضح في القدرة على عرض النصوص داخل الصور بدقة أعلى مقارنة بالإصدار السابق Imagen 3، وهي ميزة لطالما كانت تحديًا في نماذج التوليد البصري. كما أطلقت جوجل نسخة متقدمة تُدعى Imagen 4 Ultra، والتي صُممت خصيصًا للمستخدمين الذين يبحثون عن التزام صارم بتفاصيل التعليمات النصية ودقة عالية في تنفيذ العناصر البصرية.
الوصول والتسعير عبر Gemini API
توفّر جوجل النموذجين عبر واجهة Gemini API، حيث يمكن للمطورين والمستخدمين المهتمين اختبار النموذج ضمن فترة تجريبية محدودة مجانًا من خلال منصة Google AI Studio. وبالنسبة لأسعار الاستخدام، فإن تكلفة إنتاج صورة واحدة باستخدام Imagen 4 تبلغ 0.04 دولار، بينما ترتفع التكلفة إلى 0.06 دولار للصورة في نسخة Ultra، أي بزيادة تُقدّر بـ50% مقابل المزايا الإضافية.
أمثلة واقعية على الأداء

استعرضت جوجل عبر مدونتها الرسمية مجموعة من النماذج التي أنشأها Imagen 4، من بينها مشهد مصور ثلاثي اللقطات يروي قصة مركبة فضائية تتعرض لهجوم من كائن فضائي أزرق عملاق. وقد أظهرت هذه العينات قدرة النموذج على فهم التعليمات النصية وتحويلها إلى محتوى بصري غني ومترابط، وكأنه جزء من لعبة أو فيلم ثلاثي الأبعاد.
مقارنة مع النماذج المنافسة
ورغم التحسينات التي قدمها Imagen 4، إلا أن المراجعات الأولية تشير إلى أنه لا يزال أقل تقدمًا من بعض النماذج المنافسة مثل DALL·E 3 وMidjourney 7، خاصة فيما يتعلق بجودة التفاصيل الفنية والإبداع البصري. ومع ذلك، فإن جوجل تعزز موقعها تدريجيًا في هذا المضمار، لا سيما مع إطلاق نموذج Veo 3 الذي حقق تقدمًا ملحوظًا في مجال توليد الفيديو باستخدام الذكاء الاصطناعي.
خلاصة
يمثل إطلاق Imagen 4 خطوة جديدة لجوجل في سباق تطوير نماذج توليد الصور عبر الذكاء الاصطناعي، مع وعود واضحة بتحسين الأداء وسد الفجوة مع المنافسين. وبينما ينتظر المطورون والمبدعون المزيد من التجارب العملية، يبدو أن المعركة بين عمالقة الذكاء الاصطناعي في مجال الإبداع البصري لا تزال في بدايتها.
هل ترغب أن أضيف في نهاية المقال زر دعوة للتجربة المجانية عبر Google AI Studio أو مقارنة مباشرة بالنماذج الأخرى مثل DALL·E؟
إرسال تعليق