آيدوجرام: مُولِّد صور بالذكاء الاصطناعي يتفوق على المنافسين ويتجاوز كل من ميدجورني ودال-إي 3

يأتي مُنافِس جديد نسبيًا بقوة لاقتلاع صدارة مجال توليد الصور، حيث يتفوّق في الجوانب التي تفشل فيها برامج توليد الصور الأكثر شهرة.

أعلنت شركة آيدوجرام للذكاء الاصطناعي، وهي شركة ناشئة أسسها مهندسون سابقون في جوجل إلى جانب أعضاء من مؤسسات مرموقة مثل جامعة كاليفورنيا بيركلي وجامعة كارنيجي ميلون وجامعة تورنتو، عن إصدار النسخة الكاملة الأولى من برنامجها لتوليد الصور الذي يحمل نفس الاسم.

وجاء في منشور رسمي على مدونة آيدوجرام للذكاء الاصطناعي: “يسعدنا إطلاق آيدوجرام 1.0، وهو نموذج تحويل النص إلى صورة الأكثر تقدمًا لدينا حتى الآن. تم تدريب آيدوجرام 1.0 من البداية مثل جميع نماذج آيدوجرام، ويوفر معالجة نصية متطورة وواقعية لا مثيل لها والتزامًا تامًا بالمطالبات وميزة جديدة تسمى موجه سحري (Prompt Magic) تساعدك على كتابة أوصاف تفصيلية للحصول على صور جميلة وإبداعية.”

يأتي الإصدار إلى جانب أخبار عن جمع تمويل بقيمة 80 مليون دولار من الفئة الأولى بقيادة Andreessen Horowitz، إلى جانب Redpoint Ventures وPear VC وSV Angel.

تمكن موقع Decrypt من اختبار النموذج ولم تكن ادعاءات آيدوجرام للذكاء الاصطناعي مبالغًا فيها إلى حد كبير – يمكن العثور على مقارنة جنبًا إلى جنب أدناه. يعد الإصدار الأول من آيدوجرام تحسينًا واضحًا على الإصدارات السابقة v0.1 و v0.2: فهو يتفوق في الالتزام بالمطالبات وجودة الصورة وقدرات إنشاء النص.

النموذج ليس مفتوح المصدر، لذلك هناك رؤية محدودة لأدواته الداخلية ولا توجد ورقة بحثية لتقييمه. لكن النتائج التي تم الحصول عليها مع النموذج تتحدث عن نفسها، مما يجعلها أفضل نموذج متاح حاليًا – على الأقل حتى يتم الإصدار العام لـ Stable Diffusion 3.

يعتبر النموذج الجديد أفضل مُولِّد صور من حيث قدرات النص، حيث يقوم بإنشاء سلاسل نصية أطول بأخطاء أقل من Dall-E 3 أو MidJourney. كما تمنحه الطبقة المجانية الحالية ميزة على منافسين مثل Dall-E 3 و MidJourney، حيث لا يقدم الأخير طبقة مجانية. يستخدم Microsoft Copilot أيضًا Dall-E 3، ولكنه يولد فقط صورًا مربعة 1: 1، بينما يدعم آيدوجرام مجموعة أوسع من نسب العرض إلى الارتفاع.

تقدم آيدوجرام أيضًا خطتين مدفوعتين بقيمة 7 دولارات و 15 دولارًا شهريًا، والتي تتيح الوصول إلى أكثر من 400 عملية توليد يوميًا إلى جانب مزايا أخرى مثل محرر الصور، وعمليات تنزيل ذات جودة أفضل، و img2img – والتي تسمح بالتعديلات أو الاختلافات على صورة موجودة، والجيل الخاص. تعرض جميع المستويات الأدنى الصور المطلوبة علانية.

آيدوجرام قادر على فهم المطالبات الطويلة، حيث يتنافس مع Stable Diffusion 3، ويتفوق على جميع برامج توليد الصور الأخرى في هذا المجال.

إحدى الميزات البارزة في آيدوجرام هي “موجه سحري”، والتي يمكن تشغيلها وإيقاف تشغيلها. تحلل هذه الميزة المطالبة وتعززها لإنشاء صور ذات جودة أفضل، مما يمنح النموذج القدرة على فهم اللغة الطبيعية مثل Dall-E 3. ومع ذلك، فإن آيدوجرام أكثر تنوعًا لأن هذه الميزة اختيارية. يتم تشغيلها دائمًا مع ChatGPT Plus، مما يؤدي أحيانًا إلى عدم الدقة.

أخيرًا، يخضع آيدوجرام لرقابة أقل صرامة من MidJourney و Dall-E 3، ويمكنه حتى الآن إنشاء صور لشخصيات مشهورة وشعارات شركات وأنماط فنية. إنه لا ينتقل تمامًا إلى المحتوى غير اللائق، ولكنه أكثر تحفظًا فيما يتعلق بمطالبات الرقابة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.