همه چیز درباره مدل ویدیویی هوش مصنوعی Adobe
مدل ویدیویی هوش مصنوعی Adobe اکنون وارد بازار شده و در نرمافزار Premiere Pro نیز به کار گرفته شده است. این شرکت با مدل ویدیویی Firefly که از اوایل سال 2024 به آن اشاره کرده بود، به دنیای ویدیوهای تولید شده توسط هوش مصنوعی ورود کرده است. امروز، این مدل در کنار چند ابزار جدید، از جمله ابزارهایی که مستقیماً در Premiere Pro قرار گرفتهاند، منتشر شده است که به خلاقان امکان میدهد فیلمها را گسترش دهند و ویدیوهایی از تصاویر ثابت و دستورات متنی تولید کنند.
اولین ابزار کدام است ؟
اولین ابزار به نام Generative Extend در نسخه بتای Premiere Pro عرضه میشود. این ابزار میتواند برای گسترش ابتدا یا انتهای ویدیوهایی که کمی کوتاه هستند استفاده شود، یا در میانه ویدیو تغییراتی ایجاد کند، مثلاً جهت تصحیح خطوط دید چشم یا حرکات غیرمنتظره. با این حال، ویدیوها تنها میتوانند به مدت دو ثانیه گسترش یابند، بنابراین این ابزار بیشتر برای رفع مشکلات جزئی مناسب است و میتواند جایگزین برداشت دوباره صحنههای مشکلدار شود.
کلیپهای گسترش یافته میتوانند با کیفیت 720p یا 1080p و با سرعت 24 فریم در ثانیه تولید شوند. همچنین این ابزار بر روی صدا نیز قابل استفاده است تا ویرایشها را صافتر کند، هرچند محدودیتهایی وجود دارد. به عنوان مثال، این ابزار میتواند افکتهای صوتی و صدای محیط را تا 10 ثانیه گسترش دهد، اما بر روی دیالوگها یا موسیقی تاثیر نخواهد داشت.
سایر ابزارها
دو ابزار دیگر برای تولید ویدیو به صورت آنلاین راهاندازی میشوند. ابزارهای متن به ویدیو و تصویر به ویدیو Adobe که اولین بار در سپتامبر معرفی شدند، اکنون به صورت بتای عمومی محدود در اپلیکیشن وب Firefly در دسترس هستند.
ابزار متن به ویدیو عملکردی مشابه سایر تولیدکنندگان ویدیو مانند Runway و Sora (ساخته OpenAI) دارد. افراد تنها نیاز دارند که یک توصیف متنی برای چیزی که میخواهند تولید کنند وارد کنند. این ابزار میتواند انواع سبکها مانند فیلمهای واقعی، انیمیشن سهبعدی، و استاپ موشن را تقلید کند، و کلیپهای تولید شده میتوانند با استفاده از یک سری از کنترلهای دوربین مانند زوایای دوربین، حرکت و فاصله تصویربرداری، بیشتر تنظیم شوند.
ابزار تصویر به ویدیو یک قدم فراتر میرود و به شما اجازه میدهد یک تصویر مرجع همراه با یک دستور متنی اضافه کنید تا کنترل بیشتری بر نتایج داشته باشید. Adobe پیشنهاد میدهد که این ابزار میتواند برای تولید ویدیوهای اضافی (B-roll) از تصاویر و عکسها استفاده شود یا برای تجسم برداشتهای مجدد با بارگذاری یک عکس از یک ویدیو موجود کمک کند.
با این فناوری به این زودیها نمیتوانید فیلمهای کاملی بسازید. طول کلیپهای تولید شده با ابزارهای متن به ویدیو و تصویر به ویدیو در حال حاضر حداکثر پنج ثانیه است و کیفیت آنها به 720p با نرخ 24 فریم بر ثانیه محدود شده است. در مقایسه، OpenAI اعلام کرده که ابزار Sora میتواند ویدیوهایی تا یک دقیقه تولید کند، در حالی که کیفیت بصری و تطابق با دستور فرد را حفظ میکند، اما این ابزار علیرغم معرفی آن چند ماه قبل از ابزارهای Adobe، هنوز برای عموم در دسترس قرار نگرفته است.
ابزارهای متن به ویدیو، تصویر به ویدیو و Generative Extend حدود 90 ثانیه زمان نیاز دارند تا ویدیو تولید کنند، اما Adobe اعلام کرده که در حال کار بر روی یک حالت «توربو» است تا این زمان را کاهش دهد. با وجود محدودیتها، Adobe ادعا میکند که ابزارهای آن که با مدل ویدیویی هوش مصنوعی خود پشتیبانی میشوند، از لحاظ تجاری ایمن هستند، زیرا این ابزارها بر پایه محتوایی که این شرکت مجوز استفاده از آنها را داشته، آموزش دیدهاند.
این در حالی است که مدلهایی از سایر ارائهدهندگان مانند Runway به دلیل احتمال آموزش بر روی هزاران ویدیوی جمعآوریشده از یوتیوب، یا حتی در مورد Meta احتمالاً ویدیوهای شخصی کاربران، تحت بررسی قرار گرفتهاند. این مسئله میتواند برای برخی افراد به ویژه از نظر تجاری مزیت مهمی باشد.
یکی دیگر از مزایای این ابزارها این است که ویدیوهای ساخته شده یا ویرایش شده با مدل ویدیویی Firefly Adobe میتوانند با اعتبار محتوایی (Content Credentials) همراه شوند تا استفاده از هوش مصنوعی و حقوق مالکیت هنگام انتشار آنلاین آشکار شود. هنوز مشخص نیست که این ابزارها چه زمانی از حالت بتا خارج میشوند، اما حداقل در دسترس عموم قرار گرفتهاند، چیزی که نمیتوان درباره ابزارهای Sora از OpenAI ،Movie Gen از متا، و Veo از گوگل گفت.
کلام آخر
مدل ویدیویی هوش مصنوعی Adobe با ورود به نرمافزار Premiere Pro و ابزارهای مبتنی بر هوش مصنوعی Firefly توانسته است قدمی مهم در پیشرفت فناوری تولید ویدیو بردارد. این ابزارها مانند Generative Extend، متن به ویدیو و تصویر به ویدیو امکانهایی جدید را برای ویرایش و تولید ویدیو به افراد خلاق ارائه میدهند که میتواند مشکلات جزئی و نیاز به برداشتهای مجدد را کاهش دهد.
هرچند این فناوری هنوز محدودیتهایی دارد، از جمله طول کلیپهای کوتاه (حداکثر پنج ثانیه) و کیفیت متوسط (720p با 24 فریم در ثانیه)، اما در عین حال میتواند برای پروژههای تجاری مفید باشد، زیرا از لحاظ حقوقی و مالکیت محتوایی مطمئن است. از طرف دیگر، مزایای دیگری مانند اعتبار محتوایی (Content Credentials) که به شفافیت در استفاده از هوش مصنوعی و حقوق مالکیت کمک میکند، میتواند جذابیت بیشتری برای افراد حرفهای داشته باشد.
هرچند این ابزارها هنوز در فاز بتا هستند و قابلیتهای آنها محدود است، اما در دسترس بودن عمومی آنها نسبت به ابزارهای مشابه یک مزیت محسوب میشود. با گذشت زمان و بهبود این فناوری، انتظار میرود که Adobe با ابزارهای قدرتمندتر و پیشرفتهتری وارد بازار شود و نقش بزرگی در آینده تولید ویدیوهای هوش مصنوعی ایفا کند. البته فناوری های هوش مصنوعی فقط محدود به تصویر نیست و در لوازم صوتی مانند اسپیکر و هدفون نیز قابل مشاهده است.
پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!