تحديث نماذج Gemini 3.1 وإطلاق منصة Google Flow: بنية معمارية جديدة للإنتاج المرئي وتوليد الفيديو
في تطور يعيد صياغة قدرات الذكاء الاصطناعي التوليدي في المجال المرئي، أعلنت جوجل عن دمج نماذج “Gemini Omni Flash” المتقدمة مع إطلاق منصة “Google Flow” المخصصة لهندسة وتحرير الفيديو. على خلاف أدوات تحويل النص إلى فيديو (Text-to-Video) البسيطة، تأتي المنصة كبيئة إنتاج (Creative Studio) متكاملة تلبي احتياجات المطورين وصناع المحتوى الذين يتطلب عملهم تحكماً هيكلياً دقيقاً في المخرجات البصرية.
البنية التقنية لمنصة Google Flow
تعتمد المنصة في بنيتها التحتية على تكامل محرك توليد الفيديو “Veo 3” -المسؤول عن المعالجة الرسومية والفيزيائية عالية الدقة- مع قدرات الاستنتاج والفهم العميق لنموذج “Gemini Omni Flash”. هذا الدمج يوفر ميزات متقدمة تشمل:
- هندسة المشاهد والاستمرارية (Scene & Character Consistency): تتجاوز المنصة توليد المقاطع العشوائية لتسمح ببناء مسارات عمل بصرية متسلسلة (Scene Builder). يمكن للمستخدمين تحديد شخصيات أو بيئات ثابتة، والاحتفاظ بخصائصها الدقيقة (كالهوية البصرية وتناسق الحركة) عبر مشاهد متعددة، وهو ما يعالج إحدى أكبر الثغرات في النماذج السابقة.
- التحكم الموجه في زوايا العرض (Parameterized Camera Controls): توفر المنصة تحكماً دقيقاً يضاهي أدوات الإخراج الفعلي، حيث يمكن توجيه الكاميرا وحركتها (Dolly, Pan, Tilt) واختيار أنواع العدسات وعمق الميدان (Depth of Field) سواء عبر واجهة التحكم أو من خلال الاستفسارات النصية (Prompts) المعقدة.
- التحرير التفاعلي بالوكلاء (Agentic Editing): تعمل نماذج Gemini كـ “وكيل ذكي” داخل المنصة، مما يسمح بإجراء تعديلات تكرارية (Iterative) على الفيديوهات باستخدام الأوامر التخاطبية. يمكن للمستخدم دمج مقاطع فيديو أصلية مع نصوص وصور مرجعية (Reference Images)، ليقوم النموذج بدمجها مع الحفاظ على التناسق الفيزيائي للمشهد.
قدرات Gemini Omni Flash في المعالجة متعددة الوسائط
يُمثل نموذج Gemini Omni Flash قفزة في المعالجة الأصيلة متعددة الوسائط (Native Multimodal). فهو لا يقوم فقط بتوليد البيكسلات، بل يُحاكي ديناميكيات العالم الحقيقي وقواعد الفيزياء بناءً على معرفة تراكمية بالبيئة. يتيح ذلك للنموذج استيعاب التغييرات المعقدة في الإضاءة والمحاكاة الحركية بفعالية، مما يقلل من التشوهات البصرية المعتادة في النماذج الأقدم.
الاعتبارات التشغيلية والأدوات المخصصة
إلى جانب أدوات التحرير المباشرة، تتيح Google Flow للمشتركين بناء مسارات عمل مخصصة (Custom Tools) لتكرار المهام البصرية المعقدة وتخصيصها لتلبي متطلبات محددة، مثل إنشاء الشروحات التقنية أو النماذج التوضيحية (Interactive Demos) للمؤسسات.
تخضع المنصة لاعتبارات تشغيلية تعتمد على نظام الأرصدة (Credit-based System) المرتبط بفئات اشتراك محددة (مثل Google Flow 3 ضمن باقات Google AI Paid Tiers). يتطلب هذا النهج من مسؤولي التقنية وصناع المحتوى تخطيطاً دقيقاً للموارد عند دمج هذه الأدوات ضمن بيئات العمل المؤسسية ذات الميزانيات التشغيلية المحددة.



إرسال التعليق