Project Genie ile marshmallow kaleler: DeepMind’in etkileşimli dünya denemesi

Project Genie nedir?

Project Genie, DeepMind tarafından geliştirilen ve metin veya görsel girdilerle etkileşimli oyun dünyaları oluşturan deneysel bir yapay zeka aracıdır. ABD’deki Google AI Ultra abonelerine açılan prototip, araştırma amaçlı kullanıcı geri bildirimi ve veri toplama için kullanılmaya başlandı.

Nasıl çalışıyor?

Kullanıcı önce bir dünya taslağı sunuyor: ortam ve ana karakter için kısa açıklamalar ya da referans fotoğrafları giriliyor. Ardından Nano Banana Pro bu girdilerden bir görsel üretiyor; bu görsel üzerinde küçük düzenlemeler yapılabiliyor. Son aşamada Genie görseli temel alarak keşfedilebilir, 3B benzeri bir dünyaya dönüştürüyor. Oluşturulan dünyalar galeri üzerinden keşfedilebiliyor, var olan dünyalar remixlenebiliyor ve navigasyon videoları indirilebiliyor.

A claymation tarzı marshmallow kale (görsel gösterimi)

Dünya modellerinin önemi

Dünya modelleri, bir ortamın içsel temsilini üreten ve gelecekteki durumları tahmin etme, plan yapma yeteneği olan sistemlerdir. DeepMind gibi araştırma grupları, bu modellerin daha genel yapay zekâya (AGI) giden yolda kritik bir adım olduğunu düşünüyor. Kısa vadede ise oyun ve eğlence uygulamaları ile simülasyon tabanlı robot eğitimi gibi alanlarda ilk ticari kullanım örnekleri hedefleniyor.

Deneyim: Şekerden kaleler ve kısıtlar

Denemede en başarılı anlardan biri, bir zamanların hayalini gerçekleştiren bulutların üstünde marshmallow kaleler dünyasıydı. Claymation estetiğiyle yaratılan pastel spireler ve çikolata akıntılı hendek, modelin sanatsal ve fantastik tarzlarda ne kadar etkileyici olabildiğini gösterdi. Ancak modelin sınırları da belirgindi:

Bir oyuncak karakterin masa çevresinde keşif yapması (görsel gösterimi)

Etkileşim ve teknik sınırlamalar

Project Genie şu anda her oturum için 60 saniye keşif süresiyle sınırlandırılmış durumda. Bunun nedeni, otomatik ardışık (autoregressive) dünya modellerinin yoğun hesaplama gereksinimleri ve ayrılmış donanım kaynakları. Bu sınırlama, daha fazla kullanıcıya erişim sağlamak amacıyla konmuş.

Etkileşim açısından hâlâ geliştirilmesi gereken noktalar var: karakterlerin duvarların içinden geçmesi, yönlendirme kontrollerinin (W-A-S-D, ok tuşları, boşluk) zaman zaman yanıtsız kalması veya beklenmedik yönlere sapması gibi hatalar deneyimi zorluyor. Ayrıca modelin ürettiğini hatırlama yeteneği genellikle başarılı olsa da tutarsızlıklar gözlemlenebiliyor.

Gelecek ve beklentiler

DeepMind ekibi, Project Genie’yi son kullanıcıya yönelik bir günlük ürün olarak değil, benzersiz ve başka yöntemlerle elde edilemeyen deneyimler sunan bir araştırma prototipi olarak görüyor. Öncelikler arasında gerçekçilik ve etkileşim yeteneklerinin iyileştirilmesi, kullanıcı kontrolünün artırılması ve modelin tutarlılığının yükseltilmesi bulunuyor. Kullanıcı geri bildirimleri, bu iyileştirmeler için önemli veri kaynağı olacak.

Özetle, Project Genie sanat ve hayal gücüne dayalı dünyalarda etkileyici sonuçlar sunuyor; ancak fotogerçekçilik, stabil navigasyon ve bazı etkileşimsel mekaniklerde önemli geliştirmelere ihtiyaç duyuyor. Bu alanlardaki ilerlemeler, dünya model tabanlı uygulamaların oyunlardan simülasyona ve robotik eğitime uzanan daha geniş kullanım alanlarına yol açabilir.

Exit mobile version