Odyssey’nin Yeni AI Modeli ile 3D Etkileşimli Dünyalar Akışa Geçiyor

Odyssey, kendini sürücüsüz araç teknolojileri ile tanıtan girişimciler Oliver Cameron ve Jeff Hawke tarafından kurulan bir startup olarak, kullanıcıların akışta olan videolarla etkileşime girmesine olanak tanıyan bir AI modeli geliştirdi.

Web üzerinde “erken demo” olarak sunulan bu model, her 40 milisaniyede bir video kareleri üretiyor ve akışa geçiriyor. Temel kontroller aracılığıyla izleyiciler, bir video içindeki alanları keşfedebiliyor; bu deneyim, 3D tasarlanmış bir video oyununa benziyor.

Odyssey, bir blog yazısında, “Dünyanın mevcut durumu, gelen bir eylem ve geçmişteki durumlar ile eylemler göz önüne alındığında, model dünyanın bir sonraki durumunu tahmin etmeye çalışıyor.” şeklinde açıklamasını yapıyor. “Bunu destekleyen yeni bir dünya modeli, gerçekçi hisseden pikseller üretme, mekansal tutarlılığı sağlama, videolardan eylemleri öğrenme ve 5 dakika veya daha uzun süre boyunca uyumlu video akışları çıkartma yeteneklerini gösteriyor.”

Ayrıca, birçok startup ve büyük teknoloji şirketi dünya modelleri üzerinde çalışıyor. Bu şirketler arasında DeepMind, ünlü AI araştırmacısı Fei-Fei Lee’nin World Labsı, Microsoft ve Decart yer alıyor. Bu şirketler, dünya modellerinin bir gün etkileşimli medya, oyunlar ve filmler oluşturmak için kullanılabileceğine inanıyorlar.

Ancak yaratıcılar, bu teknoloji hakkında karışık duygulara sahipler. Son zamanlarda yapılan bir araştırma, Activision Blizzard gibi oyun stüdyolarının AI kullanarak iş gücünü azaltmaya çalıştığını ortaya koydu. Ayrıca, 2024’te yapılan bir çalışma, AI nedeniyle 100.000’den fazla ABD merkezli film, televizyon ve animasyon işinin etkilenebileceğini tahmin ediyor.

Odyssey, yaratıcı profesyonellerle işbirliği yapma sözü veriyor; onları yerlerine koyma niyetinde değil.

“Etkileşimli video, taleplere göre oluşturulan ve keşfedilen tamamen yeni eğlence biçimlerine kapı açıyor.” diyor firma. “Zamanla, bugünün tüm videolarının – eğlence, reklamcılık, eğitim, eğitim, seyahat ve daha fazlası – etkileşimli videolara dönüşeceğine inanıyoruz.”

Odyssey’nin demosu henüz tam olarak olgunlaşmamış durumda; bu durum firmanın blogunda da belirtiliyor. Modelin ürettiği ortamlar bulanık ve bozuk bir görünüm sunarken, düzenleri her zaman sabit kalmıyor. Bir yöne doğru ilerlediğinizde veya döndüğünüzde, çevre aniden farklı görünebilir.

Ancak firma, şu anda Nvidia H100 GPU kümeleri üzerinden saniyede 30 kareye kadar video akışı yapabilen modelini hızla geliştireceğini taahhüt ediyor. Kullanıcı başına 1-2 dolar maliyetle sunuluyor.

“İleriye dönük olarak, dinamikleri çok daha gerçekçi bir şekilde yakalayan zengin dünya temsilleri üzerinde araştırmalar yapıyoruz.” diyor Odyssey. “Paralel olarak, hareketten dünya etkileşimine kadar eylem alanını genişletiyor, büyük ölçekli videolardan açık eylemleri öğreniyoruz.”

Odyssey, dünya modelleme alanında birçok AI laboratuvarından farklı bir yaklaşım benimsiyor. Gerçek dünya manzaralarını yakalamak için 360 derecelik, sırt çantası monteli bir kamera sistemi tasarladı. Bu sistemin, yalnızca kamuya açık verilere dayalı olarak eğitilmiş modellere göre daha yüksek kaliteli modeller oluşturabileceğine inanıyorlar.

Bugüne kadar, Odyssey 27 milyon dolar yatırım aldı. Yatırımcıları arasında EQT Ventures, GV ve Air Street Capital bulunuyor. Ayrıca, Pixar‘ın kurucu ortaklarından ve eski Walt Disney Animasyon Stüdyoları başkanı olan Ed Catmull, girişimin yönetim kurulunda yer alıyor.

Geçtiğimiz Aralık ayında, Odyssey, yaratıcıların modellerinden üretilen sahneleri Unreal Engine, Blender ve Adobe After Effects gibi araçlara yükleyerek düzenlemelerine olanak tanıyan bir yazılım üzerinde çalıştığını duyurdu.

Exit mobile version