معرفی هوش مصنوعی Sora؛ برترین هوش مصنوعی ساخت ویدیو؟
اینبار هوش مصنوعی سورا با تبدیل متن به ویدیو در اینترنت غوغا بهپا کرده است. Sora میتواند ویدیوهایی به مدت یک دقیقه تولید کند و در عین حال کیفیت بصری را حفظ کرده و به درخواست کاربر پایبند باشد.سورا دارای معماری مبدل (transformer architecture) است؛ یعنی عملکرد شبکه عصبی آن مشابه Chat GPT میباشد.
OpenAI گفته است سورا میتواند صحنههای پیچیده با شخصیتهای متعدد، انواع حرکت خاص و جزئیات دقیق سوژه و پسزمینه را تولید کند.سورا نه تنها آنچه را که کاربر در اعلان درخواست کرده است، میفهمد، بلکه چگونگی وجود آن چیزها در دنیای فیزیکی را نیز درک میکند.
عملکرد سورا چگونه است؟
شاید برای شماهم سوال باشد که سورا چه عملکردی دارد؟
ما به هوش مصنوعی یاد میدهیم که دنیای فیزیکی در حال حرکت را درک و شبیهسازی کند، با هدف مدلهای آموزشی که به مردم کمک میکند مشکلاتی را که نیاز به تعامل در دنیای واقعی دارند حل کنند.
همچنین هوش مصنوعی سورا میتواند از یک تصویر استاتیک، ویدیوهای جذابی تولید کند و به تدریج با حذف نویز در طی مراحل مختلف، آن را تغییر میدهد.این مدل درک عمیقی از زبان دارد و آن را قادر میسازد تا به طور دقیق اعلانها را تفسیر کند و شخصیتهای قانعکنندهای ایجاد کند که احساسات پر جنب و جوش را بیان میکنند.گفتنی است که سورا علاوه بر اینکه میتواند تنها از دستورالعملهای متنی، یک ویدیو تولید کند؛ میتواند یک تصویر ثابت موجود را بگیرد و از آن یک ویدیو تولید کند.
sora میتواند محتوای تصویر را با دقت و توجه به جزئیات کوچک متحرک کند.ما فیلمها و تصاویر را بهعنوان مجموعهای از واحدهای کوچکتر از دادهها به نام وصلهها نشان میدهیم که هر کدام شبیه یک نشانه در GPT هستند.
مطالب پیشنهادی

تیم بروکس که از اعضای تیم تحقیقاتی پروژهی Sora میباشد گفته است: مدل جدید ما توانایی یادگیری هندسهی سهبعدی محیط را دارد و ما هیچ دخل و تصرفی در خلق ویدیوها نداریم. ویدیوهای تولیدشده توسط Sora حاصل تماشای حجم وسیعی از دادهها است. Sora بر اساس تحقیقات گذشته در مدلهای DALL·E و GPT است. از تکنیک بازنویسی از DALL·E 3 استفاده میکند که شامل ایجاد زیرنویسهای بسیار توصیفی برای دادههای آموزشی بصری است. در حال حاضر سورا دارای نقاط ضعف میباشد که کارشناسان در حال بر طرف کردن آنها میباشد.
برای مثال ممکن است جزئیات مکانی یک اعلان را اشتباه بگیردو ممکن است با توصیف دقیق رویدادهایی که در طول زمان رخ میدهند، مانند دنبال کردن یک مسیر دوربین خاص، مشکل داشته باشد.
چه کسانی به Sora دسترسی دارند؟
در حال حاضر سورا توسط محققان امنیتی در حال بررسی میباشد و فعلا در دسترس کاربران قرار نگرفته است.
OpenAI موقتا دسترسی Sora را در اختیار تیم های قرمز و گروه کوچکی از هنرمندان تجسمی، فیلمسازان و طراحان قرار داده است. آنها باید از ایمن بودن آن قبل از انتشار عمومی، اطمینان پیدا کنند و خطرات حیاتی را ارزیابی نمایند.درحال حاضر تاریخ دقیقی از انتشار عمومی سورا در دسترس نمیباشد. ما پیشرفت تحقیقات خود را زود به اشتراک می گذاریم تا کار با افراد خارج از OpenAI را شروع کنیم و از آنها بازخورد بگیریم .
هدف ما این است به مردم این احساس را بدهیم که قابلیت های هوش مصنوعی در افق چیست. محققان در حال ساخت ابزارهایی برای کمک به شناسایی محتوای گمراهکننده هستند.این ابزار طبقهبندیکننده تشخیص که میتواند متوجه دهد شود چه زمانی یک ویدیو توسط Sora تولید شده است.همچنین علاوه بر توسعه تکنیکهای جدید برای آمادهسازی برای استقرار، از روشهای ایمنی موجود برای محصولات خود استفاده میکنند.

سخن نهایی
همانطور که میدانید دنیای تکنولوژی و هوش مصنوعی با سرعت زیاد در حال پیشرفت و توسعه میباشند.هوش مصنوعی Sora که محصول OpenAI میباشد در زمینه تبدیل متن به ویدیو بسیار پر قدرت ظاهر شده است.در حال حاضر تعداد محدودی میتوانند از این هوش مصنوعی استفاده کنند.اما به زودی زود به صورت عمومی معرفی میشود و در دسترس همه کاربران قرار میگیرد.
هنوز مشخص نیست که استفاده از این هوش مصنوعی رایگان است یا خیر اما به احتمال خیلی زیاد برای استفاده کامل از امکانات آن باید اشتراک اکانت OpenAI را خریداری کنید.

دیدگاهتان را بنویسید