ساعد تدفق برنامج أفلام الذكاء الاصطناعى من Google المبدعين على إنشاء 100 مليون مقطع فيديو

وصل تدفق برنامج تصوير الذكاء الاصطناعي من Google إلى معلم. أكدت Tech Dev حصريًا أن CNET قد أنتجت أجهزة الإنفلونزا أكثر من 100 مليون مقطع فيديو لمنظمة العفو الدولية في البرنامج. يسمح طراز الفيديو المتقدم AI ، بفضل Veo 3 ، للزهور بتحريرها معًا لإنشاء مقاطع فيديو وإنشاء مشاهد.

فوجئت Google بالتدفق في مؤتمر مطوري I/O السنوي. وفقًا لـ Elias Roman ، مدير إدارة المنتجات المتدنية للتدفق إلى Google Labs ، فإن معظم الوقت “يثير فقط للحفاظ على الطلب”.

يتم تفريغ الأنفلونزا من عمل الذكاء الاصطناعي السابق من Google. لسنوات ، ركزت الشركة على جهود Gemini ، مع التركيز على الجوزاء ، وهي زورق الدردشة فيه. لقد غمرت منتجاتها مع الذكاء الاصطناعى ، مثل Search AI Review و Gmail’s AI-Infield Summons. تقوم أداة مساعد البحث ، Bookbor LM ، التي يمكن تحويل مولد AI Audio الذي يمكن تحويله إلى بودكاست شخصي ، أن ينتج ميزات جديدة بشكل دائم.

أنفق رائد الصناعة مليارات الدولارات في محاولة للفوز بالسباق لإنتاج أحدث عمليات البحث عن Google والمطورين ونعم ، حتى بالنسبة للفنانين والمبدعين. تعد 100 مليون مقطع فيديو من الذكاء الاصطناعي للشركة علامة فارقة مهمة ، وتساعدنا على إظهار كيف يبدو مستقبل إنشاء AI-AI.

اذهب إلى تدفق الذكاء الاصطناعي

لمواجهة القابلة والمستقرة ، أنشأت Google مجموعة من نماذج صور الذكاء الاصطناعى ، والتي تم تسميتها بالفعل FX ، وهي معروفة الآن باسم الصورة (“المفهوم”). لم تكن نماذج الوسائط التوليدية السابقة جيدة للمبدعين ، ولكن ليس كل المبدعين.

أسقطت Google أحدث طراز فيديو AI Veo 3 في مؤتمر I/O في مايو. قفز Veo 3 إلى حد ما إلى حد ما ، تطوير مقاطع فيديو من الذكاء الاصطناعى التي تحتوي على وئام ، AI-Generation Audio. تلقى النموذج الكثير من الاهتمام عبر الإنترنت ، وأبلغت Google عن أكثر من 40 مليون مقطع فيديو من الذكاء الاصطناعي بعد سبعة أسابيع فقط.

قال رومان: “ما سمح V3 كان مجموعة أوسع من الأشخاص الذين اعتادوا إنتاج مقاطع فيديو مضطر للغاية ، وسحبت جميع الحواس خارج الصندوق. لم يكن عليك خياطة مجموعة الأدوات معًا.” “أن تكون قادرًا على القيام بـ FOLI (الأصوات الصوتية) ، والمؤثرات الصوتية ، ومقطوعة الصوت ، والحوار ، وكلها ، وعدم إجبار المستخدم على التفكير في كل من هذه الطرق بطريقة معينة ، في رأيي ، إنها أيضًا فتحة ضخمة.”

VEO 3 هي واحدة من العديد من طرز الذكاء الاصطناعي التي يمكنك استخدامها في جهاز المخرج. تم تصنيع التدفق للمبدعين المحترفين ولافتات الأفلام ، وهي خطوة من سلالة الصور والفيديو البسيطة المتوفرة مع الجوزاء. قال رومان إن Google ابتعدت عن عمد عن صورتها FX الأصلية وطورت واجهة ، وأراد الجمع بين تدفق أحدث طرازات Imagan و Veo مع الجوزاء ، والتي تم استخدامها في تدريب VO و “يتحدث بشكل رئيسي على المنظر المحلي”.

Flow هي وسيلة للجمع بين جميع نماذج الذكاء الاصطناعى والقطع ، حيث يقوم الفيديو السلس بإنشاء وتوحيد العديد من نماذج Google Google AI.

هل يختلف التدفق عن Veo و Imagen

تم إجراء التدفق للتركيز على الاتساق ، والقدرة على الحفاظ على الهوية البصرية من مقطع إلى آخر. إذا كان لديك مقطع فيديو من 90 من شخصيتك في المقهى ، فأنت لا تريد أن يتغير طول شعرهم أو لون العين بين المشاهد كل 8 ثوانٍ. هذا الاتساق مهم للمشاريع المهنية ، ومن الصعب أيضًا تحقيقه. أطلق عليها رومان اسم “Ai Achilles Hill of AI Video”.

يحتوي تدفق التدفق على عدة أدوات للمساعدة في الحفاظ على هذا الاتساق ، وفي اختباري ، يتحكمون في عملك على مستوى جديد يفتقر إلى أول أدوات Google AI. أفضل طريقة لتحديد التدفق هي إصدار متقدم من واجهة مولد الفيديو البسيطة ، والتي لديها خيار تصدير مقاطع متعددة إلى إصدار سهل من جدول زمني مثل Premier Pro.

غالبًا ما تتم ترقية أدوات الذكاء الاصطناعي على أمل أن تكون أكثر فائدة للمبدعين المحترفين ، على الرغم من أن الجماهير المستهدفة لا تنجذب إلى استخدامها. تعتبر الذكاء الاصطناعي التوليدي مشكلة مثيرة للجدل في الصناعات الإبداعية ، خاصة عندما يتعلق الأمر بإنشاء النص والصورة والفيديو. يمكن لعشاق الذكاء الاصطناعى تقدير إبداع وسرعة نماذج الذكاء الاصطناعى ، لكن المبدعين يواصلون التعبير عن مخاوف مشروعة بشأن كيفية تدريب الذكاء الاصطناعي والنشر. هذا هو السبب في رفع الناشرين والفنانين دعوى قضائية ضد شركات الذكاء الاصطناعى المتهمين بانتهاك حقوق الطبع والنشر. هذا هو السبب في أن العمال في البيانات -الصناعات ريتش يواجهون مخاوف عمل لأن السلطة التنفيذية تريد تقليل التكاليف.

مشكلة أخرى مع الذكاء الاصطناعي هي أن نوع الصور التي يمكن أن تنشئها. في العام الماضي ، حصل المستهلكون على الجوزاء يمكن أن تنتج الصور الزي العسكري النازي للأشخاص الملونين. اعتذرت Google للشركة عن “بعض صور توليد الصور التاريخية” و قال كان يعمل على تحسين هذه الصور على الفور.

(إرشادات Google ممنوع خلق سوء المعاملة ومحتوى الذكاء الاصطناعي غير الشرعي. وقال رومان إن المرطبات التقنية والاستخدام الحقيقي للحياة والتقارير تساعد في تحسين تنفيذ سياسات السلامة الخاصة بها.)

المضي قدمًا ، قال رومان إن التدفق يعمل على تعزيز قدرات VEO 3 ، وتحسين الاتساق ، وإضافة ميزات جديدة مثل Sounds Baspic لأعمال الشخصيات. نجمة North Project تجعل الخلق في متناول الناس.

وقال رومان: “يمكننا تقليل العقبات التي يمكن أن تمنع الناس من سرد القصص من خلال الفيديو ، ويمكننا رفع سقف القصص التي يمكن سماعها من خلال الفيديو”. “سيكون بعضهم سخيفًا وغبيًا ، مثل مقابلات Wild Street أو مدونو Yety Asmar ، وبعضهم قوي حقًا.”

كيفية استخدام Google Flow لمقاطع فيديو AI

يمكن الوصول إلى التدفق ، الذي يعد جزءًا من Google Labs واختبار AI من خلال المطبخ ، متاح للدفع Google AI خطةها البالغة 20 دولارًا كل شهر و 250 دولارًا كل شهر خطة فائقة (معفاة حاليًا عند 125 دولارًا لمدة ثلاثة أشهر). مختبرات Google إشعار الخصوصية يقول: “يقرأ المراجعون البشريون ، وتفسيرهم ، وتفسيرهم ، وتفسيرهم ، لتحسين نموذج الذكاء الاصطناعي الخاص بهم. (بيانات مختبراتك آمنة لمدة 18 شهرًا من حيث التخلف عن السداد ، وتنصحك الشركة بتحميل أو تقديم معلومات سرية. مركز الخصوصية العادي من Google هناك المزيد من المعلومات.)

قضيت بعض الوقت لاختبار التدفق وإعداد المقاطع وخياطةها معًا باستخدام منشئ المشهد. العديد من الأدوات متوفرة فقط للزهور.

فيديو من المكونات: لديك طريقتان للإشارة إلى مقاطع الفيديو ، بما في ذلك النص الذاتي -إلى -5 وفيديو من الصور/الإطارات. المكونات جديدة للعثور على الفيديو. باستخدام هذا الإجراء ، تقوم بتحميل صور محددة وإضافة موجه نص ، وسيضرب أجزاء التدفق معًا. على سبيل المثال ، يمكنك تحميل صورة الرجل ، وصورة منتج محددة ، وخلفية طبيعية ، ثم الجمع بين التدفق وتشغيل الفيديو.

زيادة المقاطع والتحويلات السلسة: يمكن أن يساعدك التمديد في إطالة المقاطع. في الجدول الزمني للمشهد ، اسحب نهاية إطار مقطع إلى الطول المطلوب. إذا كنت ستنتج مقطع فيديو جديدًا وتريد نقلًا سلسًا ، فإنني أوصي بالانتقال إلى نهاية المقطع الأول واضغط على الزر Plus في الجزء العلوي من العلامة لحفظ الإطار النهائي في مكتبتك. يمكنك بعد ذلك استخدام هذه الصورة في مطالبة Frame -to -video للحفاظ على هذا الاتساق من المقطع إلى المقطع.

المهربة وتحرير: إذا كنت تقوم بتحرير إطار أو صورة في مستند منفصل ، فيمكنك تحميل صورتك المميزة لتدفق وتوجيه النموذج لتطبيق التغييرات. يمكنك أيضًا القيام بذلك التقطت صورك ، ويمكن أن تنعش هذه الرسامات الرسومية. هذه ميزة نامية.

للإشارة إلى صالة الألعاب الرياضية: لا توجد طريقة لإنشاء الجوزاء تلقائيًا و/أو لتحسين التدفق المباشر للمؤشر (شيء آمل أن أغير تحديث المستقبل) ، ولكن يمكنك استخدام مركب الدردشة للمساعدة في إعداد المطالبة المثالية. إذا كنت تكافح من أجل إحياء الأفكار الأكثر تفصيلاً ، فحاول مساعدة Gemini لك.

لمعرفة المزيد ، راجع دليلًا لكتابة مولدات صور AI أعلاه وأفضل مؤشرات صورة AI.