تكنولوجيا الذكاء الاصطناعي تحقق قفزة في توليد الصور الواقعية
شهدت تكنولوجيا توليد الصور من النصوص تطورا ملحوظا بفضل النماذج المتقدمة مثل نماذج الانتشار. ولم يعد الأمر يتطلب مهارات في برامج التصميم التقليدية مثل فوتوشوب. بل أصبح يعتمد على هندسة وصف دقيقة توجه نماذج الذكاء الاصطناعي لاستخراج تفاصيل بصرية معقدة بدقة عالية.
أوضح الباحثون أن نماذج توليد الصور تمنح الكلمات الأولى في الوصف وزنا أكبر مقارنة بالكلمات الأخيرة. مما يتطلب ترتيب عناصر الوصف بشكل تسلسلي دقيق. فالبنية المثالية لوصف صورة واقعية تتضمن عدة عناصر أساسية تشمل:
- الموضوع الأساسي: تحديد الكائن المحوري مثل إنسان أو منتج مع تفاصيل دقيقة مثل ملمس البشرة.
- البيئة والمحيط: تحديد الخلفية، الطقس، وتفاعل الضوء في المكان.
- هندسة الإضاءة: وهو عنصر حاسم لتحقيق الواقعية، حيث تفهم بعض النماذج مثل ميدجورني المصطلحات الفيزيائية للضوء بدقة.
- محاكاة الكاميرا والعدسات: عبر تقديم مواصفات عدسات حقيقية مثل عدسة 85 ملم لتوليد عمق ميداني.
حسب أبحاث تطوير الألعاب والتصميم الرقمي، تتيح بعض النماذج مثل ستايبل ديفيوجن التحكم في قوة الكلمات باستخدام الأقواس والمعاملات الرقمية. كما تساهم الأوصاف السلبية في استبعاد التشوهات ومنع النموذج من توليد أخطاء بصرية مثل الأيدي المشوهة.
تشير التقارير إلى أن النماذج الرائدة في هذا المجال تعتمد على تقنيات نشر متطورة. مثل ميدجورني، الذي يعتبر الأقوى في محاكاة التفاصيل البشرية، ودال-إي 3 من أوبن إيه آي، الذي يتميز بفهم استثنائي للغة الطبيعية.
لتوليد صورة واقعية، يجب اختيار المحرك المناسب. تعتمد النماذج الرائدة على تقنيات متقدمة تساهم في إنتاج صور ذات جودة عالية. ولتحقيق ذلك، يجب كتابة وصف هيكلي يتضمن العناصر الأساسية.
السر يكمن في كتابة وصف دقيق ومحدد. يجب أن يتضمن الوصف الموضوع الأساسي، بيئة العمل، الإضاءة، إعدادات الكاميرا، والتفاصيل الدقيقة. فعلى سبيل المثال، بدلاً من كتابة "رجل عجوز"، يجب كتابة "رجل عجوز يبلغ من العمر 70 عامًا، تظهر على وجهه تجاعيد عميقة".
عند استخدام أدوات مثل ميدجورني أو ستايبل ديفيوجن، يمكن استخدام تقنيات متقدمة مثل الأوامر السلبية لمنع العيوب الشائعة. كما يمكن استخدام معامل الواقعية لتقليل النزعة الفنية وزيادة الواقعية.
على الرغم من التقدم الكبير، لا تزال هناك تحديات مثل معالجة الإشكالية الأكبر المتعلقة بالأيدي والعيون. ومع ذلك، فإن الجهود المبذولة لتحسين النماذج أثبتت نجاحها بشكل ملحوظ.
