هوش مصنوعی جدید متا

معرفی هوش مصنوعی جدید متا

در این مقاله به معرفی هوش مصنوعی جدید متا میکنیم و از قابلیت های به شما میگوییم. متا اخیراً پیش‌نمایش مدل‌های هوش مصنوعی جدید خود به نام Movie Gen را معرفی کرد که به تولید و ویرایش ویدیو، صدا و تصاویر میپردازد. یکی از ویژگی‌های چشمگیر این مدل‌ها، توانایی ساخت ویدیوهای واقعی از یک عکس ساده از یک شخص است. شرکت ادعا میکند که این مدل‌ها در مقایسه با سایر مدل‌های ویدیو-سنتز از نظر انسانی عملکرد بهتری دارند و ما را به آینده‌ای نزدیک‌تر میکند که در آن هر فرد میتواند به سادگی ویدیوهای کاملی از هر موضوعی بر اساس درخواست خود تولید کند.

هنوز برنامه‌ای برای زمان یا نحوه انتشار عمومی این قابلیت‌ها اعلام نشده است، اما متا میگوید که Movie Gen ابزاری است که به افراد امکان میدهد خلاقیت ذاتی خود را تقویت کنند، نه اینکه جایگزین هنرمندان و انیماتورهای انسانی شود. این شرکت برای آینده استفاده‌هایی مانند ساخت و ویرایش آسان ویدیوهای روزمره برای شبکه‌های اجتماعی یا تولید تبریک‌های تولد شخصی‌سازی شده با انیمیشن را تصور میکند.

Movie Gen بر اساس کارهای قبلی متا در زمینه سنتز ویدیو، از جمله مدل‌های Make-A-Scene (2022) و مدل سنتز تصویر Emu ساخته شده است. این سیستم جدید، برای اولین بار قادر است ویدیوهای سفارشی با صدا تولید کند، تغییراتی در ویدیوهای موجود اعمال کند و تصاویر افراد را به ویدیوهای شخصی‌سازی شده واقعی تبدیل کند. این سیستم از پرامپت‌های متنی برای هدایت و تولید محتوا استفاده میکند و قابلیت‌های وسیع‌تری را برای ویرایش ویدیوها فراهم میکند.

مدل ویدیو-سازی Movie Gen میتواند ویدیوهایی با کیفیت 1080p و به مدت حداکثر 16 ثانیه با 16 فریم در ثانیه تولید کند. این مدل میتواند بر اساس توصیف‌های متنی یا ورودی تصویری ویدیو بسازد و قادر به مدیریت مفاهیم پیچیده مانند حرکت اشیا، تعامل بین سوژه‌ها و اشیا و حرکات دوربین است.

هوش مصنوعی جدید متا

این فناوری میتواند تأثیرات قابل توجهی بر صنعت تولید محتوا و سرگرمی بگذارد، اما در عین حال سوالاتی را در خصوص جایگاه هنرمندان و خلاقیت انسانی در برابر هوش مصنوعی برمی‌انگیزد. با وجود قابلیت‌های چشمگیر Movie Gen در تولید ویدیوهای واقعی از تصاویر ساده، عملکرد این مدل احتمالاً وابسته به ویدیوهای نمونه‌ای است که متا برای آموزش مدل‌های سنتز ویدیوی خود استفاده کرده است. همان‌طور که در گذشته نیز با تولیدکننده‌های ویدیوی هوش مصنوعی دیده‌ایم، نتایج انتخاب‌شده معمولاً بسیار متفاوت از خروجی‌های معمولی هستند و برای رسیدن به نتیجه منسجم، اغلب نیاز به آزمون و خطاهای زیادی است.

در مورد داده‌های آموزشی، متا اعلام کرده که مدل‌های خود را با استفاده از ترکیبی از داده‌های دارای مجوز و مجموعه‌های داده عمومی آموزش داده است. این احتمال وجود دارد که شامل ویدیوهای بارگذاری‌شده توسط کاربران فیسبوک و اینستاگرام طی سال‌های گذشته باشد، اگرچه این ادعا بر اساس سیاست‌های فعلی متا و رفتارهای قبلی آن صرفاً حدس و گمان است.

هوش مصنوعی جدید متا

ورود به عصر جدید دیپ‌فیک‌های ویدیویی

یکی از ویژگی‌های کلیدی Movie Gen که متا معرفی کرده، ایجاد ویدیوهای شخصی‌سازی شده است. اما این ویژگی اساساً همان فناوری دیپ‌ فیک است که از سال 2017 مطرح شد. فناوری دیپ‌فیک نگرانی‌های جدی در میان برخی کارشناسان برانگیخته، زیرا میتواند برای شبیه‌سازی تصاویر و ویدیوهای واقعی استفاده شود، به‌طوری که افراد به انجام کارهایی نشان داده میشوند که در واقع هرگز انجام نداده‌اند.

در این مورد، ساخت دیپ‌فیک با Movie Gen به سادگی ارائه یک تصویر ورودی از فرد و یک پرامپت متنی است که توصیف میکند چه کاری باید انجام دهد یا در چه مکانی باشد. سیستم سپس ویدیویی تولید میکند که آن فرد را نشان میدهد و تلاش میکند هویت و حرکات او را حفظ کند، در حالی که جزئیات پرامپت را در ویدیو ادغام میکند.

این فناوری میتواند به روش‌های متعددی مورد سوءاستفاده قرار گیرد، از جمله ساخت ویدیوهای تحقیرآمیز، قرار دادن افراد در شرایط نادرست و ساختگی، جعل تاریخ یا موارد دیگر. این تکنولوژی ما را به سمتی میبرد که مرز بین حقیقت و تخیل در رسانه‌ها بدون بررسی دقیق‌تر از بین میرود و تمایز میان آن‌ها دشوار خواهد بود.

در ماه آوریل، مایکروسافت مدل VASA-1 را معرفی کرد که میتواند از یک عکس و یک فایل صوتی، ویدیویی واقع‌گرایانه از یک فرد که در حال صحبت است ایجاد کند. اما Movie Gen یک گام جلوتر رفته و فرد دیپ‌فیک شده را در یک صحنه ویدیویی، چه تولید شده توسط هوش مصنوعی و چه واقعی، قرار میدهد. با این حال، به نظر میرسد Movie Gen هنوز قادر به تولید یا هماهنگ‌سازی گفتار نیست.

هوش مصنوعی جدید متا

چالش‌های اخلاقی و حقوقی

این پیشرفت‌ها در زمینه دیپ‌ فیک، چالش‌های اخلاقی و حقوقی قابل توجهی را ایجاد میکنند. هرچند متا از Movie Gen به عنوان ابزاری برای تقویت خلاقیت انسانی یاد میکند، اما کاربردهای بالقوه مخرب آن میتواند تاثیرات جدی بر حریم خصوصی افراد و اعتماد عمومی به رسانه‌ها بگذارد. همان‌طور که فناوری‌های سنتز محتوا پیشرفت میکنند، نیاز به قوانین و ابزارهای تشخیص دقیق‌تری برای مقابله با دیپ‌فیک‌های خطرناک نیز بیشتر احساس میشود.

Movie Gen از متا یک ابزار قدرتمند و چندمنظوره است که نه تنها به تولید ویدیوهای جدید میپردازد، بلکه امکانات ویرایش و صداگذاری پیچیده‌ای را نیز به ارمغان می‌آورد. این سیستم قادر است تغییرات دقیقی را در ویدیوهای موجود ایجاد کند، به طوری که بر اساس دستورالعمل‌های متنی، ویرایش‌های محلی مانند افزودن یا حذف عناصر خاص را انجام دهد. همچنین امکان تغییرات کلی مانند تغییر پس‌زمینه یا سبک کلی ویدیو وجود دارد.

یکی از ویژگی‌های برجسته Movie Gen توانایی تولید صدا همراه با ویدیو است. تا پیش از این، مدل‌های سنتز ویدیو تنها ویدیوهای بی‌صدا تولید میکردند. اما اکنون متا با استفاده از یک مدل تولید صدا، امکان تولید صدای محیطی، افکت‌های صوتی و موسیقی پس‌زمینه سازگاریافته با محتوای ویدیو را از طریق پرامپت‌های متنی فراهم کرده است. این مدل میتواند برای ویدیوهایی با هر طولی، صدایی یکپارچه و منسجم تولید کند و آن را به‌طور هم‌زمان با ویدیو هماهنگ کند که شما بتوانید از طریق اسپیکر و هدفون آن را بشنوید.

هوش مصنوعی جدید متا

چالش‌ها و محدودیت‌ها

با وجود این پیشرفت‌ها، متا اذعان دارد که مدل‌های فعلی دارای محدودیت‌هایی هستند. این شرکت برنامه دارد تا با مقیاس‌بندی بیشتر مدل‌ها، زمان تولید ویدیو را کاهش داده و کیفیت کلی خروجی را بهبود ببخشد.

بازخورد از فیلمسازان و هنرمندان

متا همچنین قصد دارد با فیلمسازان و خالقان محتوا همکاری کند تا بازخوردهای آن‌ها را در نسخه‌های آینده مدل‌ها ادغام کند. با این حال، با توجه به هشدارهای اتحادیه بازیگران SAG-AFTRA در سال گذشته و واکنش‌های منفی برخی از متخصصان صنعت نسبت به سنتز ویدیو، پیش‌بینی میشود که همه بازخوردها مثبت نباشد.

در حالی که برخی از هنرمندان ممکن است از امکانات گسترده این فناوری استقبال کنند، دیگران نگرانی‌هایی درباره از دست دادن اصالت خلاقیت انسانی و جایگزینی هنر با تولیدات خودکار دارند. این فناوری پتانسیل دارد که روند تولید محتوا را به طرز چشمگیری تغییر دهد، اما همچنین بحث‌هایی را درباره اخلاقیات و تأثیرات اجتماعی آن به وجود خواهد آورد.

مسیر پیش‌رو

پیشرفت‌های Movie Gen در زمینه سنتز صدا و ویرایش ویدیو، میتواند به خلاقیت بیشتر خالقان محتوا کمک کند. با این حال، همچنان چالش‌های زیادی وجود دارد، از جمله واکنش‌های منفی صنعت به استفاده گسترده از هوش مصنوعی در تولید ویدیو و آثار هنری. متا به نظر میرسد که در حال حاضر محتاطانه به این مسیر نگاه میکند و با گسترش توانمندی‌های مدل‌های خود و همکاری با هنرمندان، به دنبال یافتن تعادلی مناسب میان فناوری و هنر است.

هوش مصنوعی جدید متا

کلام آخر

Movie Gen از متا گامی بزرگ در مسیر پیشرفت فناوری‌های تولید ویدیو و صدا با استفاده از هوش مصنوعی به شمار میرود. این سیستم با امکاناتی مانند ایجاد ویدیوهای واقعی از یک عکس، ویرایش دقیق ویدیوها بر اساس پرامپت‌های متنی، و تولید صدای محیطی و موسیقی پس‌زمینه، ظرفیت‌های جدیدی برای خالقان محتوا و هنرمندان فراهم کرده است.

مسیر آینده Movie Gen و مدل‌های مشابه به این بستگی دارد که چگونه فناوری هوش مصنوعی با اخلاقیات و نوآوری‌های انسانی همگام شود. همکاری متا با فیلمسازان و هنرمندان میتواند به بهبود این مدل‌ها کمک کند، اما پذیرش گسترده این فناوری در صنعت به‌طور کامل به نحوه برخورد با چالش‌های اخلاقی و اجتماعی آن بستگی خواهد داشت.