كشفت شركة جوجل Google عبر مدونتها الرسمية عن نموذجين جديدين طورهما فريق البحث في الشركة Google Research اعتمادا على تقنيات الذكاء الصناعي AI والتعلم الآلي ML، وهما إيماجين Imagen وبارتي Parti القادرين على إنشاء صورا واقعية من النصوص أو تحويل النص إلى صورة، لكن كليهما يستخدمان أساليب مختلفة.
كيف تعمل نماذج تحويل النص إلى صورة ؟
وتعتمد نماذج تحويل النص إلى صورة على تقنيات الذكاء الصناعي والتعلم الآلي، بحيث يقدم الأشخاص وصفا نصيا لينتج النموذج أو البرمجية صورا واقعية أو إبداعية تتطابق مع الوصف قد الإمكان، بحيث يمكن للمستخدم كتابة نص تفاحة ترتدي قبعة على سبيل المثال أو قطة تجلس على أريكة، مع إمكانية إنشاء صورا أكثر تعقيدا بناء على الوصف في النص.
وقالت جوجل أنه خلال السنوات الماضية دربت نماذج التعلم الآلي ML على مجموعات بيانات صور كبيرة مع أوصاف نصية مقابلة، وهو ما أدى إلى إمكانية إنتاج صورا عالية الجودة مع دعم نطاق أوسع من الأوصاف، كما أشارت جوجل إلى تحقيق نماذج أخرى مثل DALL-E 2 من Open AI اختراقا كبيرا في هذا المجال.












