جيميناي أومني: ثورة جديدة في توليد مقاطع الفيديو بالذكاء الاصطناعي
أعلنت غوغل عن إطلاق عائلة نماذج جديدة تدعى "جيميناي أومني"، والتي تقدم تجربة متطورة في توليد مقاطع الفيديو باستخدام الذكاء الاصطناعي. ويبدأ هذا العرض بنموذج "أومني فلاش"، الذي تم الكشف عنه خلال مؤتمر المطورين الأخير.
تكمن ميزة "جيميناي أومني" في قدرتها على توليد مقاطع الفيديو من مجموعة متنوعة من المدخلات، بما في ذلك الصور والنصوص ومقاطع الفيديو، مما يتيح للمستخدمين إنشاء محتوى بدون الحاجة لكتابة أوامر معقدة. وأوضح القائمون على المشروع أن هذا النموذج يحرر المستخدمين من قيود الأدوات السابقة، مثل "فيو"، حيث يمكنهم الآن العمل مباشرة مع أي نوع من المدخلات.
أضافت غوغل أن "أومني" تتيح للمستخدمين إمكانية تعديل مقاطع الفيديو الموجودة بسهولة ويسر، وذلك دون الحاجة إلى مهارات متقدمة في المونتاج. وأشار التقرير إلى أن المستخدم يمكنه ببساطة رفع صورة واستخدام أدوات "أومني" لتوليد مقطع فيديو يتضمن الشخصيات أو العناصر الموجودة في الصورة.
كشفت غوغل أيضًا عن إمكانية تعديل الصور ومقاطع الفيديو بشكل مباشر، حيث يمكن للمستخدمين استخدام الأداة لتعديل مقاطع الفيديو السابقة أو حتى إنشاء مقاطع جديدة تمامًا باستخدام الأوامر الصوتية. وأكدت أن العملية بسيطة، حيث يكفي أن يصف المستخدم ما يرغب في تعديله ليقوم النظام بتحويل ذلك إلى مقطع جديد جاهز للمشاركة.
تتناول هذه الأداة العديد من الاستخدامات، بدءًا من تعديل مقاطع الفيديو إلى إنشاء صور رمزية تشبه المستخدم، والتي يمكن تحريكها واستخدامها في المحتوى. وأكدت غوغل أن هذه الميزات تأتي لتسهيل عملية إنتاج المحتوى للمستخدمين، وتقليل الوقت اللازم للمونتاج.
بينما تظل قدرات "أومني فلاش" محصورة في توليد مقاطع فيديو لا تتجاوز مدتها 10 ثوان، صرحت مديرة إدارة المنتجات في غوغل، نيكول بريشتوفا، أن هذا القرار يهدف إلى توفير تجربة مريحة للمستخدمين، حيث يتمكن الجميع من الاستفادة من الأداة بسهولة.
وأكدت غوغل أن جميع المقاطع المولدة ستتحمل علامة "سينث آي دي"، التي تسهل التعرف على مقاطع الفيديو المولدة بالذكاء الاصطناعي، مما يساهم في حماية المستخدمين من سوء الاستخدام. وأشارت إلى أن هذه التقنية تهدف إلى تيسير العمل على صناع المحتوى وتقليل الوقت المطلوب لإنتاج مقاطع الفيديو.
من جهة أخرى، ذكرت غوغل أن "أومني" تعتمد على نماذج ذكاء اصطناعي متطورة، حيث تدمج بين نموذج "جيميناي" والبيانات التي تم تدريبه عليها، مما يسمح بفهم القوانين الطبيعية بشكل أفضل. وبالتالي، فإن مقاطع الفيديو التي يتم إنتاجها ستكون أكثر واقعية وستلتزم بالقوانين الفيزيائية.
تسعى غوغل من خلال "أومني" إلى تقليل الفجوة بين التكنولوجيا والمستخدمين العاديين، مما يجعل إنتاج محتوى الفيديو متاحًا للجميع دون الحاجة لمعرفة تقنية معقدة. ومع ذلك، تظل التحديات قائمة فيما يتعلق باستخدام هذه التكنولوجيا في إنتاج محتوى غير مقبول، حيث تعمل غوغل على وضع آليات للحد من إساءة الاستخدام.
