همچنین ادعا شده که این مدل تولید ویدیو می تواند فیزیک دنیای واقعی را به دقت شبیه سازی کند که بیشتر مدل های فعلی با آن دست و پنجه نرم می کنند. این مدل همچنین می تواند صورت و بدن افراد را به صورت سه بعدی بازسازی کند تا حرکت اندام ها در ویدیو ها به شکل واقعی نمایش داده شود.
همه این ها به لطف متدولوژی VAE سه بعدی و وضوح متغیر است که باعث می شود این مدل تقریبا به هر نوع شی در هر محیطی زندگی اضافه کند. در حال حاضر بسیاری از مدل های هوش مصنوعی تولید متن به ویدیو وجود دارند، اما این شبیه سازی های فیزیکی است که چشم ها را جلب می کند.
رسیدن به شبیه سازی های هم زمان پویا در دنیای مولد امروزی کار آسانی نیست. هوش مصنوعی Sora به ما نشان داد که چقدر عالی برای کارآمد بودن در تکرار این مکانیسم ها آموزش دیده است و اکنون Kling AI نیز همین کار را انجام می دهد.