Google DeepMind’in Project Genie’siyle Marshmallow Kaleler Kurdum
Projeye kısa bakış
Google DeepMind, metin veya görsel girdilerden etkileşimli oyun dünyaları üreten deneysel aracı Project Genie’ye erişimi genişletiyor. Şu aşamada yalnızca ABD’deki Google AI Ultra abonelerine açılan prototip; arkasında Genie 3, görsel üretim modeli Nano Banana Pro ve Gemini kombinasyonu bulunuyor.
Amacı ve bağlamı
DeepMind, beş ay önce yayınlanan Genie 3 araştırma ön izlemesinin ardından kullanıcı geri bildirimi ve eğitim verisi toplamak için Project Genie’yi erişime sundu. Bunun nedeni, world model denen içsel ortam temsilleri üzerinde çalışmanın, Yapay Genel Zeka (AGI) yolunda önemli bir adım olduğu yönündeki yaygın inanç. Kısa vadede ise bu teknolojinin pazarda ilk olarak video oyunları ve eğlenceye yönelik uygulamalarla görünmesi, sonrasında simülasyonlarda robot ve gömülü ajan eğitimine evrilmesi bekleniyor.
Nasıl çalışıyor?
Kullanıcılar bir “world sketch” oluşturuyor: çevre ve ana karakter için metin istemleri yazılıyor. Nano Banana Pro, bu istemlere dayanarak bir görsel üretiyor; isterseniz üzerinde değişiklik yapabiliyorsunuz. Ardından Genie, o görseli temel alarak keşfedilebilir bir dünya yaratıyor. Galeriden hazır dünyalar seçmek, rastgeleleştiriciyle ilham almak veya var olan dünyaları remixlemek mümkün. Oluşturduğunuz dünyayı keşfedip video olarak indirebiliyorsunuz.
60 saniyelik kısıt
Project Genie şu an için her kullanıcıya 60 saniye dünya üretimi ve gezinme süresi veriyor. Bunun nedeni, Genie 3’ün oto-regresif mimarisinin yüksek hesaplama gerektirmesi; her oturum için ayrılan işlemci kaynakları sınırlı olduğundan DeepMind bu kısıtı uyguluyor. Araştırma direktörlerinden biri, bu sınırlamanın daha fazla kullanıcıya erişim sağlamak için gerekli olduğunu belirtiyor.
Deneyim: Şekerli hayaller ve gerçekçilik sınırları
Project Genie, sanatsal ve stilize istemlerde öne çıkıyor. Su bazlı sulu boya, anime ya da klasik çizgi-film estetiği gibi yaklaşımlar keskin ve etkileyici sonuçlar veriyor. Benim ilk dünyam çocukluğumun hayalini canlandıran; marshmallowlardan yapılmış, çikolata soslu bir hendek ve şeker ağaçlarıyla dolu bir gök kalesiydi. İstediğim kil animasyonu stilinde çıkan dünya tam anlamıyla büyüleyiciydi.
Öte yandan model, foto-gerçekçi veya sinematik dünyalarda sınırlı kalıyor; oluşturulan sahneler çoğunlukla oyun tarzı bir görünüm sunuyor ve gerçek insan görüntüsü beklentisini karşılamıyor. Gerçek bir ofis fotoğrafını temel alarak bir dünya oluşturduğumda, bazı mobilyalar ve nesneler korunmasına rağmen düzen değişiyor ve sonuç dijital, steril bir his veriyordu.
Etkileşim zorlukları
Projede etkileşim hâlâ geliştirilme aşamasında. Karakterler zaman zaman duvarların içinden geçiyor; kontroller (ok tuşları, W-A-S-D, boşluk tuşu) yeni kullanıcılar için tutarsız ve bazen tepkisiz olabiliyor. Benim için gezinme bazen kırık tekerlekli bir alışveriş arabasını yönlendirmeye benziyordu: hedefe düz gitmek yerine zikzaklı bir rota izleniyordu. Geri bildirimlerde bu sorunların farkında olduklarını ve ileride hem gerçekçiliği hem de kontrolü iyileştirmeyi hedeflediklerini belirtiyorlar.
Güvenlik ve telif sınırları
Güvenlik önlemleri etkin durumda: çıplaklık gibi içerikler üretilemiyor ve telif hakkı ihlali olabilecek belirli karakter veya temalar engelleniyor. Bu nedenle deniz kızları veya belirgin bir markaya ait karakterleri içeren dünyalar oluşturulamıyor. Bu tür sınırlamalar, modelin deneysel doğası ve yasal/etik kaygılar nedeniyle uygulanıyor.
Ne beklemeli?
Project Genie, hâlihazırda son kullanıcı için günlük kullanılabilir bir ürün olmaktan ziyade araştırma amaçlı bir prototip. Yine de sunduğu “başka şekilde yapılamayan” yaratıcı deneyimler sayesinde gelecekte oyun, animasyon ve robotik simülasyonlar gibi alanlarda yeni uygulamalara kapı aralayabileceğinin bir göstergesi. DeepMind ekibi, etkileşim yeteneklerini, gerçekçilik düzeyini ve kullanıcı kontrolünü geliştirmeyi amaçlıyor.
Özetle: Project Genie, stilize ve hayal gücüne dayalı dünyalarda etkileyici sonuçlar veren, fakat gerçekçilik, etkileşim ve stabilite konusunda hâlâ geliştirilmesi gereken bir deneysel araç. Marshmallow kaleler kurmak mümkün; fakat gerçek dünyaya daha yakın simülasyonlar için biraz daha zaman gerekiyor.







