معرفی مدل ویدیوساز Runway Gen-4.5 که از Sora و Veo قدرتمندتر عمل کرده است
استارتاپ Runway با تیم ۱۰۰ نفره خود مدل ویدیویی Gen-4.5 را معرفی کرده که در بنچمارکهای مستقل بالاتر از مدلهای گوگل و OpenAI قرار گرفته است. این مدل با درک عمیق فیزیک و جزئیات بصری، مرز بین واقعیت و ویدیوهای ساختگی را کمرنگ کرده است.

مدل ویدیوساز Runway Gen-4.5 که از رقبا پیشی گرفته است
استارتاپ Runway با تیمی متشکل از تنها ۱۰۰ نفر، از مدل ویدیویی جدید خود به نام Gen-4.5 رونمایی کرده که در بنچمارکهای مختلف مدلهای غولهای فناوری مانند گوگل و OpenAI را پشت سر گذاشته است. تمرکز اصلی این مدل بر دقت فیزیکی بوده و برخلاف مدلهای قبلی که اشیا در آنها شناور بودند یا حرکات غیرطبیعی داشتند، Gen-4.5 وزن، تکانه و نیرو را درک میکند.
- مایعات در این مدل با فیزیک واقعی جریان مییابند و رفتار طبیعی دارند
- این مدل پرامپتهای پیچیده متنی را با دقتی بیسابقه اجرا میکند
- خروجیها به قدری به واقعیت نزدیک هستند که تشخیص آنها از فیلمبرداری واقعی دشوار است
- در بنچمارک Video Arena مدل Gen-4.5 در جایگاه اول قرار گرفته است
- مدل Veo 3 گوگل در رتبه دوم و Sora 2 Pro از OpenAI در رتبه هفتم جای گرفتهاند
مدیرعامل Runway میگوید: “ما با یک تیم ۱۰۰ نفره توانستیم بر شرکتهای تریلیون دلاری غلبه کنیم. این مدل که با نام رمز دیوید ساخته شده، نشان میدهد که تمرکز و پشتکار میتواند بر بودجههای نامحدود پیروز شود.”
با وجود پیشرفتهای عظیم، این مدل هنوز کامل نیست و ممکن است در استدلال علیتها دچار خطا شود. همچنین مشکل پایداری شیء هنوز بهطور کامل رفع نشده، هرچند بسیار کمتر از قبل شده است.



