معرفی هوش مصنوعی جدید متا
در این مقاله به معرفی هوش مصنوعی جدید متا میکنیم و از قابلیت های به شما میگوییم. متا اخیراً پیشنمایش مدلهای هوش مصنوعی جدید خود به نام Movie Gen را معرفی کرد که به تولید و ویرایش ویدیو، صدا و تصاویر میپردازد. یکی از ویژگیهای چشمگیر این مدلها، توانایی ساخت ویدیوهای واقعی از یک عکس ساده از یک شخص است. شرکت ادعا میکند که این مدلها در مقایسه با سایر مدلهای ویدیو-سنتز از نظر انسانی عملکرد بهتری دارند و ما را به آیندهای نزدیکتر میکند که در آن هر فرد میتواند به سادگی ویدیوهای کاملی از هر موضوعی بر اساس درخواست خود تولید کند.
هنوز برنامهای برای زمان یا نحوه انتشار عمومی این قابلیتها اعلام نشده است، اما متا میگوید که Movie Gen ابزاری است که به افراد امکان میدهد خلاقیت ذاتی خود را تقویت کنند، نه اینکه جایگزین هنرمندان و انیماتورهای انسانی شود. این شرکت برای آینده استفادههایی مانند ساخت و ویرایش آسان ویدیوهای روزمره برای شبکههای اجتماعی یا تولید تبریکهای تولد شخصیسازی شده با انیمیشن را تصور میکند.
Movie Gen بر اساس کارهای قبلی متا در زمینه سنتز ویدیو، از جمله مدلهای Make-A-Scene (2022) و مدل سنتز تصویر Emu ساخته شده است. این سیستم جدید، برای اولین بار قادر است ویدیوهای سفارشی با صدا تولید کند، تغییراتی در ویدیوهای موجود اعمال کند و تصاویر افراد را به ویدیوهای شخصیسازی شده واقعی تبدیل کند. این سیستم از پرامپتهای متنی برای هدایت و تولید محتوا استفاده میکند و قابلیتهای وسیعتری را برای ویرایش ویدیوها فراهم میکند.
مدل ویدیو-سازی Movie Gen میتواند ویدیوهایی با کیفیت 1080p و به مدت حداکثر 16 ثانیه با 16 فریم در ثانیه تولید کند. این مدل میتواند بر اساس توصیفهای متنی یا ورودی تصویری ویدیو بسازد و قادر به مدیریت مفاهیم پیچیده مانند حرکت اشیا، تعامل بین سوژهها و اشیا و حرکات دوربین است.
این فناوری میتواند تأثیرات قابل توجهی بر صنعت تولید محتوا و سرگرمی بگذارد، اما در عین حال سوالاتی را در خصوص جایگاه هنرمندان و خلاقیت انسانی در برابر هوش مصنوعی برمیانگیزد. با وجود قابلیتهای چشمگیر Movie Gen در تولید ویدیوهای واقعی از تصاویر ساده، عملکرد این مدل احتمالاً وابسته به ویدیوهای نمونهای است که متا برای آموزش مدلهای سنتز ویدیوی خود استفاده کرده است. همانطور که در گذشته نیز با تولیدکنندههای ویدیوی هوش مصنوعی دیدهایم، نتایج انتخابشده معمولاً بسیار متفاوت از خروجیهای معمولی هستند و برای رسیدن به نتیجه منسجم، اغلب نیاز به آزمون و خطاهای زیادی است.
در مورد دادههای آموزشی، متا اعلام کرده که مدلهای خود را با استفاده از ترکیبی از دادههای دارای مجوز و مجموعههای داده عمومی آموزش داده است. این احتمال وجود دارد که شامل ویدیوهای بارگذاریشده توسط کاربران فیسبوک و اینستاگرام طی سالهای گذشته باشد، اگرچه این ادعا بر اساس سیاستهای فعلی متا و رفتارهای قبلی آن صرفاً حدس و گمان است.
ورود به عصر جدید دیپفیکهای ویدیویی
یکی از ویژگیهای کلیدی Movie Gen که متا معرفی کرده، ایجاد ویدیوهای شخصیسازی شده است. اما این ویژگی اساساً همان فناوری دیپ فیک است که از سال 2017 مطرح شد. فناوری دیپفیک نگرانیهای جدی در میان برخی کارشناسان برانگیخته، زیرا میتواند برای شبیهسازی تصاویر و ویدیوهای واقعی استفاده شود، بهطوری که افراد به انجام کارهایی نشان داده میشوند که در واقع هرگز انجام ندادهاند.
در این مورد، ساخت دیپفیک با Movie Gen به سادگی ارائه یک تصویر ورودی از فرد و یک پرامپت متنی است که توصیف میکند چه کاری باید انجام دهد یا در چه مکانی باشد. سیستم سپس ویدیویی تولید میکند که آن فرد را نشان میدهد و تلاش میکند هویت و حرکات او را حفظ کند، در حالی که جزئیات پرامپت را در ویدیو ادغام میکند.
این فناوری میتواند به روشهای متعددی مورد سوءاستفاده قرار گیرد، از جمله ساخت ویدیوهای تحقیرآمیز، قرار دادن افراد در شرایط نادرست و ساختگی، جعل تاریخ یا موارد دیگر. این تکنولوژی ما را به سمتی میبرد که مرز بین حقیقت و تخیل در رسانهها بدون بررسی دقیقتر از بین میرود و تمایز میان آنها دشوار خواهد بود.
در ماه آوریل، مایکروسافت مدل VASA-1 را معرفی کرد که میتواند از یک عکس و یک فایل صوتی، ویدیویی واقعگرایانه از یک فرد که در حال صحبت است ایجاد کند. اما Movie Gen یک گام جلوتر رفته و فرد دیپفیک شده را در یک صحنه ویدیویی، چه تولید شده توسط هوش مصنوعی و چه واقعی، قرار میدهد. با این حال، به نظر میرسد Movie Gen هنوز قادر به تولید یا هماهنگسازی گفتار نیست.
چالشهای اخلاقی و حقوقی
این پیشرفتها در زمینه دیپ فیک، چالشهای اخلاقی و حقوقی قابل توجهی را ایجاد میکنند. هرچند متا از Movie Gen به عنوان ابزاری برای تقویت خلاقیت انسانی یاد میکند، اما کاربردهای بالقوه مخرب آن میتواند تاثیرات جدی بر حریم خصوصی افراد و اعتماد عمومی به رسانهها بگذارد. همانطور که فناوریهای سنتز محتوا پیشرفت میکنند، نیاز به قوانین و ابزارهای تشخیص دقیقتری برای مقابله با دیپفیکهای خطرناک نیز بیشتر احساس میشود.
Movie Gen از متا یک ابزار قدرتمند و چندمنظوره است که نه تنها به تولید ویدیوهای جدید میپردازد، بلکه امکانات ویرایش و صداگذاری پیچیدهای را نیز به ارمغان میآورد. این سیستم قادر است تغییرات دقیقی را در ویدیوهای موجود ایجاد کند، به طوری که بر اساس دستورالعملهای متنی، ویرایشهای محلی مانند افزودن یا حذف عناصر خاص را انجام دهد. همچنین امکان تغییرات کلی مانند تغییر پسزمینه یا سبک کلی ویدیو وجود دارد.
یکی از ویژگیهای برجسته Movie Gen توانایی تولید صدا همراه با ویدیو است. تا پیش از این، مدلهای سنتز ویدیو تنها ویدیوهای بیصدا تولید میکردند. اما اکنون متا با استفاده از یک مدل تولید صدا، امکان تولید صدای محیطی، افکتهای صوتی و موسیقی پسزمینه سازگاریافته با محتوای ویدیو را از طریق پرامپتهای متنی فراهم کرده است. این مدل میتواند برای ویدیوهایی با هر طولی، صدایی یکپارچه و منسجم تولید کند و آن را بهطور همزمان با ویدیو هماهنگ کند که شما بتوانید از طریق اسپیکر و هدفون آن را بشنوید.
چالشها و محدودیتها
با وجود این پیشرفتها، متا اذعان دارد که مدلهای فعلی دارای محدودیتهایی هستند. این شرکت برنامه دارد تا با مقیاسبندی بیشتر مدلها، زمان تولید ویدیو را کاهش داده و کیفیت کلی خروجی را بهبود ببخشد.
بازخورد از فیلمسازان و هنرمندان
متا همچنین قصد دارد با فیلمسازان و خالقان محتوا همکاری کند تا بازخوردهای آنها را در نسخههای آینده مدلها ادغام کند. با این حال، با توجه به هشدارهای اتحادیه بازیگران SAG-AFTRA در سال گذشته و واکنشهای منفی برخی از متخصصان صنعت نسبت به سنتز ویدیو، پیشبینی میشود که همه بازخوردها مثبت نباشد.
در حالی که برخی از هنرمندان ممکن است از امکانات گسترده این فناوری استقبال کنند، دیگران نگرانیهایی درباره از دست دادن اصالت خلاقیت انسانی و جایگزینی هنر با تولیدات خودکار دارند. این فناوری پتانسیل دارد که روند تولید محتوا را به طرز چشمگیری تغییر دهد، اما همچنین بحثهایی را درباره اخلاقیات و تأثیرات اجتماعی آن به وجود خواهد آورد.
مسیر پیشرو
پیشرفتهای Movie Gen در زمینه سنتز صدا و ویرایش ویدیو، میتواند به خلاقیت بیشتر خالقان محتوا کمک کند. با این حال، همچنان چالشهای زیادی وجود دارد، از جمله واکنشهای منفی صنعت به استفاده گسترده از هوش مصنوعی در تولید ویدیو و آثار هنری. متا به نظر میرسد که در حال حاضر محتاطانه به این مسیر نگاه میکند و با گسترش توانمندیهای مدلهای خود و همکاری با هنرمندان، به دنبال یافتن تعادلی مناسب میان فناوری و هنر است.
کلام آخر
Movie Gen از متا گامی بزرگ در مسیر پیشرفت فناوریهای تولید ویدیو و صدا با استفاده از هوش مصنوعی به شمار میرود. این سیستم با امکاناتی مانند ایجاد ویدیوهای واقعی از یک عکس، ویرایش دقیق ویدیوها بر اساس پرامپتهای متنی، و تولید صدای محیطی و موسیقی پسزمینه، ظرفیتهای جدیدی برای خالقان محتوا و هنرمندان فراهم کرده است.
مسیر آینده Movie Gen و مدلهای مشابه به این بستگی دارد که چگونه فناوری هوش مصنوعی با اخلاقیات و نوآوریهای انسانی همگام شود. همکاری متا با فیلمسازان و هنرمندان میتواند به بهبود این مدلها کمک کند، اما پذیرش گسترده این فناوری در صنعت بهطور کامل به نحوه برخورد با چالشهای اخلاقی و اجتماعی آن بستگی خواهد داشت.
پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!