Kling ، هوش مصنوعی تولید ویدیو رقیب جدیدی برای Sora .


به وبلاگ روبو خوش آمدید، در این مقاله می خواهیم درباره هوش مصنوعی چینی Kling که رقیب جدیدی برای هوش مصنوعی Sora است صحبت کنیم، پس در ادامه مطلب همراهمان باشید.
اگر به اخبار صفر تا صد هوش مصنوعی علاقه دارید وبلاگ روبو را دنبال کنید.


هوش مصنوعی تولید ویدیو Kling
هوش مصنوعی Kling که توسط شرکت چینی Kuaishou ساخته شده است، ویژگی هایی مانند تولید ویدیو های طولانی تر، حرکت بهبو یافته در ویدیو ها و سکانس های دارای چند شات می شود. به گفته سازندگان آن، این مدل می تواند ویدیو های حداکثر دو دقیقه ای را با وضوح 1080p و نرخ 30 فریم درثانیه تولید کند.
در حالی که تمام دنیا منتظر راه اندازی Sora AI هستند، این مدل هوش مصنوعی اخیرا با قابلیت های چشمگیر خود، دنیا را غرق کرده است. این مدل حتی برای دسترسی آزاد نیز قابل استفاده است و بسیاری از توسعه دهندگان بیان می کنند که ویدیو های بسیار بهتری نسبت به Sora تولید می کند و می تواند رقیبی جدی برای آن باشد.
فناوری فول درایو برای حالات چهره و اندام ها با استفاده از فناوری بازسازی 3 بعدی صورت و بدن همراه با ثبات پس زمینه و ماژول های تغییر جهت، تحقق یافته است.
Kling اعمال الگو را به تصاویر ورودی شما متصل می کند و به آن تصویر برای یک صحنه خاص جان می بخشد.
در ادامه ویدیویی از پاندایی درحال نواختن گیتار را مشاهده می کنید که توسط این هوش مصنوعی ساخته شده است. هنگامی که این پاندا گیتار می نوازد تقریبا شبیه انسان به نظر می رسد.


همچنین ادعا شده که این مدل تولید ویدیو می تواند فیزیک دنیای واقعی را به دقت شبیه سازی کند که بیشتر مدل های فعلی با آن دست و پنجه نرم می کنند. این مدل همچنین می تواند صورت و بدن افراد را به صورت سه بعدی بازسازی کند تا حرکت اندام ها در ویدیو ها به شکل واقعی نمایش داده شود.
همه این ها به لطف متدولوژی VAE سه بعدی و وضوح متغیر است که باعث می شود این مدل تقریبا به هر نوع شی در هر محیطی زندگی اضافه کند. در حال حاضر بسیاری از مدل های هوش مصنوعی تولید متن به ویدیو وجود دارند، اما این شبیه سازی های فیزیکی است که چشم ها را جلب می کند.
رسیدن به شبیه سازی های هم زمان پویا در دنیای مولد امروزی کار آسانی نیست. هوش مصنوعی Sora به ما نشان داد که چقدر عالی برای کارآمد بودن در تکرار این مکانیسم ها آموزش دیده است و اکنون Kling AI نیز همین کار را انجام می دهد.


نکته چشمگیر در ویدیو های ساخته شده با این مدل، واقع گرایانه بودن آن ها است. برای عنوان مثال، در GIF بالا که توسط این مدل ساخته شده است، واقعی یا غیر واقعی بودن طوطی تقریبا غیرقابل تشخیص است.
به طور کلی به نظر می رسد که Kling در ویدیو های خود حرکات را به صورت کاملا دقیق نمایش می دهد و فیزیک دنیای واقعی را نیز به خوبی درک می کند.
بااینحال هنوز مشخص نیست که آیا Kling یا دیگر مدل های هوش مصنوعی ساخته شده توسط چین، مانند Vidu، در نهایت در دسترس کشور های دیگر هم قرار می گیرند یا خیر؛ که البته این نکته احتمالا درحال حاضر کمک زیادی به رونق سرویس های OpenAI مانند ChatGPT میکند.


سخن نهایی
انقلاب هوش مصنوعی چین در حال شتاب گرفتن است و هوش مصنوعی Kling در خط مقدم قرار دارد و رقبا برای همگام شدن با این محیط به سرعت در حال تغییر هستند. جالب است که ببینیم رقابت بین Kling و Sora چگونه پیش می رود.
برای استفاده از امکانات هوش مصنوعی ChatGPT-4o میتوانید از روبو، هوش مصنوعی فارسی، به راحتی استفاده کنید.



