Runway ilk dünya modelini tanıttı: GWM-1 ile gerçekçi simülasyon ve yerel ses dönemi
Runway’den ilk dünya modeli: GWM-1
Yapay zeka ile görsel ve video üretimi alanında öne çıkan Runway, ilk dünya modeli olan GWM-1‘i duyurdu. Model, kare kare tahmin yaparak çalışan bir simülasyon sistemi olarak tasarlandı ve şirketin açıklamasına göre fizik kurallarını ve dünyanın zaman içindeki davranışını anlamaya odaklanıyor.
Dünya modeli, gerçek hayattaki her senaryo için ayrı ayrı eğitilmeye ihtiyaç duymadan, dünyanın nasıl işlediğine dair içsel bir simülasyon öğrenen ve bu sayede akıl yürütme, planlama ve eylem yetenekleri geliştiren yapay zeka sistemini ifade ediyor.
Runway, kısa süre önce tanıttığı ve farklı platformlardaki karşılaştırmalarda öne çıkan Gen 4.5 video modelinin ardından, GWM-1 ile birlikte daha genel amaçlı bir simülasyon altyapısı sunduğunu belirtiyor. Şirket, bu modeli; robotik, yaşam bilimleri ve farklı endüstrilerde yapay ajanları eğitmek için kullanılabilecek bir temel olarak konumlandırıyor.
Şirketin CTO’su Anastasis Germanidis, bir canlı yayında, etkili bir dünya modeli inşa edebilmek için önce çok güçlü bir video modeline ihtiyaç olduğunu vurgulayarak, “Pikselleri doğrudan tahmin etmeyi öğrenen modellerin, genel amaçlı simülasyon için en doğru yol olduğuna inanıyoruz” değerlendirmesinde bulundu.
GWM-Worlds, GWM-Robotics ve GWM-Avatars: Üç farklı odak alanı
Runway, GWM-1 için üç farklı odaklı sürüm tanıttı: GWM-Worlds, GWM-Robotics ve GWM-Avatars. Şirket, bu modellerin teknik olarak ayrı çalıştığını ancak zaman içinde tek bir birleşik modelde toparlamayı hedeflediğini söylüyor.
GWM-Worlds: Etkileşimli dünyalar yaratma
GWM-Worlds, kullanıcıların etkileşimli projeler oluşturmasını sağlayan bir uygulama katmanı olarak öne çıkıyor. Kullanıcılar, bir metin komutuyla veya görsel referansla sahne tanımlayabiliyor; model de bu sahneyi keşfederken geometri, fizik ve aydınlatma kurallarını dikkate alarak dünyayı anlık olarak üretiyor.
Runway, bu simülasyonların 24 fps kare hızında ve 720p çözünürlükte çalıştığını belirtiyor. GWM-Worlds, yalnızca oyun ve eğlence için değil, aynı zamanda ajanların fiziksel dünyada gezinmeyi ve davranmayı öğrenmesi için de bir eğitim alanı olarak konumlandırılıyor.

GWM-Robotics: Robotlar için sentetik eğitim verisi
GWM-Robotics, özellikle robotik sistemler için tasarlandı. Runway, bu modelle robotların eğitiminde kullanılmak üzere, hava durumu değişiklikleri, farklı engeller ve karmaşık ortam koşulları gibi ek parametrelerle zenginleştirilmiş sentetik veri üretmeyi hedefliyor.
Bu yaklaşımın, robotların politikalara veya talimatlara ne zaman ve nasıl aykırı davranabileceğini önceden görmeyi ve test etmeyi mümkün kıldığı belirtiliyor. Şirket, GWM-Robotics‘i bir SDK üzerinden kullanıma açmayı planlıyor ve farklı robotik şirketleri ve kurumsal müşterilerle entegrasyon için görüşmeler yürütüyor.
GWM-Avatars: Gerçekçi insan avatarları
GWM-Avatars, insan davranışını taklit eden gerçekçi avatarlar üretmeye odaklanıyor. Bu modelle oluşturulan avatarların; iletişim, eğitim, müşteri etkileşimi ve içerik üretimi gibi alanlarda kullanılabilecek şekilde tasarlandığı ifade ediliyor.
Runway, GWM-Avatars ve GWM-Robotics için çeşitli büyük ölçekli şirketlerle kurumsal kullanım senaryoları üzerine aktif görüşmeler yürüttüğünü aktarıyor.
Gen 4.5 video modeline yerel ses ve çoklu sahne desteği
Dünya modeli GWM-1’in yanı sıra Runway, kısa süre önce duyurduğu Gen 4.5 video modelini de önemli ölçüde güncelledi. Yeni sürüm, modele yerel ses desteği ve uzun formlu, çoklu sahneli video üretimi gibi özellikler kazandırıyor.
Şirket, güncellenen Gen 4.5 ile kullanıcıların karakter tutarlılığını koruyan, bir dakikaya kadar videolar üretebildiğini; bu videolarda doğal diyaloglar, arka plan sesleri ve farklı açılardan çekilmiş karmaşık planların bir arada yer alabildiğini söylüyor.
Ayrıca kullanıcılar, mevcut sesleri düzenleyebiliyor, sahnelere yeni konuşma ekleyebiliyor ve uzun, çok sahneli videoları esnek biçimde montajlayabiliyor. Bu güncelleme, video üretim araçlarının prototip aşamasından çıkıp tam üretim sürecine hazır profesyonel araçlara dönüşmesinde önemli bir adım olarak değerlendiriliyor.

Runway, güncellenen Gen 4.5 modelinin tüm ücretli plan kullanıcılarına sunulduğunu belirtiyor. GWM-Robotics için sağlanacak SDK ve GWM-Avatars entegrasyonlarıyla birlikte şirket, hem yaratıcı üretim hem de fiziksel dünyaya yönelik yapay zeka uygulamaları arasında köprü kuran kapsamlı bir ekosistem oluşturmayı hedefliyor.





