أعلنت شركة جوجل عن إطلاق نموذجها الجديد للذكاء الاصطناعي "Gemini Omni"، في خطوة جديدة تعزز قدرات منظومة Gemini في مجال إنتاج المحتوى المرئي التفاعلي، حيث يتيح النموذج إنشاء وتحرير مقاطع الفيديو اعتمادًا على مدخلات متعددة تشمل النصوص والصور والصوت.

 
وقالت الشركة إن النموذج يمثل تطورًا مهمًا في تقنيات الذكاء الاصطناعي التوليدي متعدد الوسائط، إذ يجمع بين قدرات الفهم والاستدلال السياقي لنماذج Gemini، وبين إمكانيات إنتاج فيديوهات إبداعية يمكن التحكم بها بشكل مباشر عبر الأوامر النصية.
 
ويعتمد "Gemini Omni" على نظام تفاعلي يسمح للمستخدمين بإجراء تعديلات على الفيديوهات من خلال المحادثة فقط، دون الحاجة إلى أدوات مونتاج تقليدية، حيث يمكن تغيير المشاهد أو تعديل العناصر أو إعادة بناء القصة بالكامل باستخدام اللغة الطبيعية.
 
وأكدت جوجل أن النموذج يتميز بالحفاظ على الاتساق البصري للشخصيات والعناصر داخل المشاهد حتى مع التعديلات المتكررة، إضافة إلى قدرته على تنفيذ تغييرات معقدة تشمل البيئة والحركة وإضافة شخصيات جديدة أو إعادة تصور السيناريوهات.
 
كما أوضحت الشركة أن النموذج يدعم دمج مدخلات متعددة مثل الصور والرسومات والمقاطع الصوتية ومقاطع الفيديو المرجعية داخل مشهد واحد متكامل، مع تطبيق أنماط بصرية ومؤثرات مختلفة بشكل تلقائي عبر الأوامر النصية.
 
ويستفيد "Gemini Omni" من فهم متقدم للعوامل الفيزيائية مثل الجاذبية وديناميكيات الحركة والسوائل، إلى جانب قاعدة معرفية واسعة تغطي مجالات متعددة، ما يساهم في إنتاج محتوى أكثر واقعية واتساقًا من الناحية البصرية والسردية.
 
وكشفت جوجل أيضًا عن ميزة جديدة باسم "Avatars"، تتيح إنشاء شخصيات رقمية تحاكي المستخدمين ويمكن استخدامها داخل الفيديوهات، مع تأكيد الشركة أنها تعمل على تطويرها وفق ضوابط تمنع إساءة الاستخدام.
 
وفي إطار مكافحة المحتوى المضلل، أكدت جوجل أن جميع الفيديوهات المنتجة عبر "Gemini Omni" ستتضمن علامة مائية رقمية غير مرئية عبر تقنية SynthID، بما يتيح التحقق من كون المحتوى مُنتجًا أو معدّلًا بالذكاء الاصطناعي.
 
وبدأت الشركة طرح النسخة الأولى "Gemini Omni Flash" لمشتركي بعض خطط Google AI، مع إتاحته عبر تطبيق Gemini ومنصات إنتاج المحتوى مثل Google Flow وYouTube Shorts، على أن يتم توسيع الإتاحة تدريجيًا.
 
ويأتي هذا الإطلاق في ظل احتدام المنافسة بين شركات التكنولوجيا العالمية، وعلى رأسها OpenAI وميتا، لتطوير نماذج قادرة على إنتاج الفيديوهات عبر الأوامر النصية، في سباق متسارع نحو أدوات ذكاء اصطناعي أكثر تقدمًا في صناعة المحتوى المرئي.