مدل ویدیویی هوش مصنوعی Adobe

همه چیز درباره مدل ویدیویی هوش مصنوعی Adobe

مدل ویدیویی هوش مصنوعی Adobe اکنون وارد بازار شده و در نرم‌افزار Premiere Pro نیز به کار گرفته شده است. این شرکت با مدل ویدیویی Firefly که از اوایل سال 2024 به آن اشاره کرده بود، به دنیای ویدیوهای تولید شده توسط هوش مصنوعی ورود کرده است. امروز، این مدل در کنار چند ابزار جدید، از جمله ابزارهایی که مستقیماً در Premiere Pro قرار گرفته‌اند، منتشر شده است که به خلاقان امکان میدهد فیلم‌ها را گسترش دهند و ویدیوهایی از تصاویر ثابت و دستورات متنی تولید کنند.

مدل ویدیویی هوش مصنوعی Adobe

اولین ابزار کدام است ؟

اولین ابزار به نام Generative Extend در نسخه بتای Premiere Pro عرضه میشود. این ابزار میتواند برای گسترش ابتدا یا انتهای ویدیوهایی که کمی کوتاه هستند استفاده شود، یا در میانه ویدیو تغییراتی ایجاد کند، مثلاً جهت تصحیح خطوط دید چشم یا حرکات غیرمنتظره. با این حال، ویدیوها تنها میتوانند به مدت دو ثانیه گسترش یابند، بنابراین این ابزار بیشتر برای رفع مشکلات جزئی مناسب است و میتواند جایگزین برداشت دوباره صحنه‌های مشکل‌دار شود.

کلیپ‌های گسترش یافته میتوانند با کیفیت 720p یا 1080p و با سرعت 24 فریم در ثانیه تولید شوند. همچنین این ابزار بر روی صدا نیز قابل استفاده است تا ویرایش‌ها را صاف‌تر کند، هرچند محدودیت‌هایی وجود دارد. به عنوان مثال، این ابزار میتواند افکت‌های صوتی و صدای محیط را تا 10 ثانیه گسترش دهد، اما بر روی دیالوگ‌ها یا موسیقی تاثیر نخواهد داشت.

مدل ویدیویی هوش مصنوعی Adobe

سایر ابزارها

دو ابزار دیگر برای تولید ویدیو به صورت آنلاین راه‌اندازی میشوند. ابزارهای متن به ویدیو و تصویر به ویدیو Adobe که اولین بار در سپتامبر معرفی شدند، اکنون به صورت بتای عمومی محدود در اپلیکیشن وب Firefly در دسترس هستند.

ابزار متن به ویدیو عملکردی مشابه سایر تولیدکنندگان ویدیو مانند Runway و Sora (ساخته OpenAI) دارد. افراد تنها نیاز دارند که یک توصیف متنی برای چیزی که میخواهند تولید کنند وارد کنند. این ابزار میتواند انواع سبک‌ها مانند فیلم‌های واقعی، انیمیشن سه‌بعدی، و استاپ موشن را تقلید کند، و کلیپ‌های تولید شده میتوانند با استفاده از یک سری از کنترل‌های دوربین مانند زوایای دوربین، حرکت و فاصله تصویربرداری، بیشتر تنظیم شوند.

ابزار تصویر به ویدیو یک قدم فراتر میرود و به شما اجازه میدهد یک تصویر مرجع همراه با یک دستور متنی اضافه کنید تا کنترل بیشتری بر نتایج داشته باشید. Adobe پیشنهاد میدهد که این ابزار میتواند برای تولید ویدیوهای اضافی (B-roll) از تصاویر و عکس‌ها استفاده شود یا برای تجسم برداشت‌های مجدد با بارگذاری یک عکس از یک ویدیو موجود کمک کند.

با این فناوری به این زودی‌ها نمیتوانید فیلم‌های کاملی بسازید. طول کلیپ‌های تولید شده با ابزارهای متن به ویدیو و تصویر به ویدیو در حال حاضر حداکثر پنج ثانیه است و کیفیت آنها به 720p با نرخ 24 فریم بر ثانیه محدود شده است. در مقایسه، OpenAI اعلام کرده که ابزار Sora میتواند ویدیوهایی تا یک دقیقه تولید کند، در حالی که کیفیت بصری و تطابق با دستور فرد را حفظ میکند، اما این ابزار علیرغم معرفی آن چند ماه قبل از ابزارهای Adobe، هنوز برای عموم در دسترس قرار نگرفته است.

مدل ویدیویی هوش مصنوعی Adobe

ابزارهای متن به ویدیو، تصویر به ویدیو و Generative Extend حدود 90 ثانیه زمان نیاز دارند تا ویدیو تولید کنند، اما Adobe اعلام کرده که در حال کار بر روی یک حالت «توربو» است تا این زمان را کاهش دهد. با وجود محدودیت‌ها، Adobe ادعا میکند که ابزارهای آن که با مدل ویدیویی هوش مصنوعی خود پشتیبانی میشوند، از لحاظ تجاری ایمن هستند، زیرا این ابزارها بر پایه محتوایی که این شرکت مجوز استفاده از آن‌ها را داشته، آموزش دیده‌اند.

این در حالی است که مدل‌هایی از سایر ارائه‌دهندگان مانند Runway به دلیل احتمال آموزش بر روی هزاران ویدیوی جمع‌آوری‌شده از یوتیوب، یا حتی در مورد Meta احتمالاً ویدیوهای شخصی کاربران، تحت بررسی قرار گرفته‌اند. این مسئله میتواند برای برخی افراد به‌ ویژه از نظر تجاری مزیت مهمی باشد.

یکی دیگر از مزایای این ابزارها این است که ویدیوهای ساخته شده یا ویرایش شده با مدل ویدیویی Firefly Adobe میتوانند با اعتبار محتوایی (Content Credentials) همراه شوند تا استفاده از هوش مصنوعی و حقوق مالکیت هنگام انتشار آنلاین آشکار شود. هنوز مشخص نیست که این ابزارها چه زمانی از حالت بتا خارج میشوند، اما حداقل در دسترس عموم قرار گرفته‌اند، چیزی که نمیتوان درباره ابزارهای Sora از OpenAI ،Movie Gen از متا، و Veo از گوگل گفت.

مدل ویدیویی هوش مصنوعی Adobe

کلام آخر

مدل ویدیویی هوش مصنوعی Adobe با ورود به نرم‌افزار Premiere Pro و ابزارهای مبتنی بر هوش مصنوعی Firefly توانسته است قدمی مهم در پیشرفت فناوری تولید ویدیو بردارد. این ابزارها مانند Generative Extend، متن به ویدیو و تصویر به ویدیو امکان‌هایی جدید را برای ویرایش و تولید ویدیو به افراد خلاق ارائه میدهند که میتواند مشکلات جزئی و نیاز به برداشت‌های مجدد را کاهش دهد.

هرچند این فناوری هنوز محدودیت‌هایی دارد، از جمله طول کلیپ‌های کوتاه (حداکثر پنج ثانیه) و کیفیت متوسط (720p با 24 فریم در ثانیه)، اما در عین حال میتواند برای پروژه‌های تجاری مفید باشد، زیرا از لحاظ حقوقی و مالکیت محتوایی مطمئن است. از طرف دیگر، مزایای دیگری مانند اعتبار محتوایی (Content Credentials) که به شفافیت در استفاده از هوش مصنوعی و حقوق مالکیت کمک میکند، میتواند جذابیت بیشتری برای افراد حرفه‌ای داشته باشد.

هرچند این ابزارها هنوز در فاز بتا هستند و قابلیت‌های آن‌ها محدود است، اما در دسترس بودن عمومی آن‌ها نسبت به ابزارهای مشابه یک مزیت محسوب میشود. با گذشت زمان و بهبود این فناوری، انتظار میرود که Adobe با ابزارهای قدرتمندتر و پیشرفته‌تری وارد بازار شود و نقش بزرگی در آینده تولید ویدیوهای هوش مصنوعی ایفا کند. البته فناوری های هوش مصنوعی فقط محدود به تصویر نیست و در لوازم صوتی مانند اسپیکر و هدفون نیز قابل مشاهده است.