Teknoloji

Fei-Fei Li’nin girişimi World Labs, ilk ticari dünya modeli Marble’ı piyasaya sürdü

Marble ile metinden gerçeğe yakın 3D dünyalar

World Labs, yapay zeka öncülerinden Fei-Fei Li tarafından kurulan girişim, ilk ticari dünya modeli ürünü Marble’ı kullanıma açtı. Freemium ve ücretli katmanlarla sunulan Marble, metin komutları, fotoğraflar, videolar, 3D yerleşimler veya panoramik görüntülerden düzenlenebilir ve indirilebilir 3D ortamlar üretebiliyor.

İki ay önce sınırlı beta olarak tanıtılan bu üretken dünya modeli, World Labs’in gizlilik sürecinden çıktıktan sonra topladığı 230 milyon dolarlık yatırımın ardından gelen ilk ticari ürün konumunda. Dünya modelleri, bir ortamın iç temsilini oluşturarak gelecekteki durumları öngörebilen ve bu öngörülere göre eylem planlayabilen yapay zeka sistemleri olarak öne çıkıyor.

Rakiplerinden farkı: Kalıcı ve indirilebilir 3D dünyalar

Son dönemde çeşitli girişimler kendi dünya modellerini tanıtıyor. Bazı modeller, yalnızca demo amaçlı, anlık olarak üretilen etkileşimli dünyalar sunuyor. Marble’ı ayrıştıran nokta ise, bu dünyaları yalnızca keşfederken anlık olarak üretmek yerine, kalıcı, tutarlı ve indirilebilir 3D ortamlar üretmesi.

Şirket, bu yaklaşımın sahnelerdeki bozunma ve tutarsızlıkları azalttığını, ayrıca kullanıcıların oluşturdukları dünyaları Gaussian splat, mesh veya video formatlarında dışa aktarabildiğini vurguluyor.

Marble, türünün ilk örneği sayılabilecek Yapay zekâ yerel (AI-native) düzenleme araçları ve hibrit bir 3D editör ile geliyor. Kullanıcılar önce mekânın kaba mimarisini (duvarlar, hacimler, düzlemler vb.) kurguluyor, ardından görsel detayları yapay zekâya bırakabiliyor.

World Labs Marble dünya modeli örnek sahneler
Marble, metin ve görsellerden etkileşimli 3D ortamlar üretebiliyor.

World Labs kurucu ortağı Justin Johnson, bu yeni sınıf modeli şöyle özetliyor: “Bu, 3D dünyalar üreten tamamen yeni bir model kategorisi. Zamanla çok daha iyi hale gelecek ve şimdiden ciddi ilerleme kaydettik.”

İlk denemelerden lansmana: Daha gerçekçi ve daha geniş dünyalar

World Labs, geçen yıl erken prototipleriyle yalnızca tek bir fotoğraftan etkileşimli 3D sahneler üretebildiğini göstermişti. Ancak bu ilk versiyonlarda sahneler çizgi film estetiğine yakındı, hareket alanı sınırlıydı ve bazı render hataları göze çarpıyordu.

Beta sürecindeki kullanıcı testlerinde, Marble’ın yalnızca görsel komutlardan dahi etkileyici, oyun benzeri ya da gerçekçi yaşam alanları üretebildiği görülse de sahnelerin kenar bölgelerinde bozulmalar yaşanıyordu. Şirket, tam sürümle birlikte özellikle bu alanlarda önemli iyileştirmeler yaptığını belirtiyor.

Yaratıcı kontrol için yeni araçlar

Çoklu girdi: Fotoğraf, video ve panoramalardan dijital ikizler

Marble’ın yaratıcı kontrol vizyonu, giriş aşamasında başlıyor. Beta döneminde model yalnızca tek görüntü kabul ediyor, 360 derecelik bir dünya oluşturmak için geriye kalan detayları tamamen tahmin etmek zorunda kalıyordu. Lansmanla birlikte kullanıcılar artık birden fazla fotoğraf veya kısa video klipler yükleyerek aynı mekânı farklı açılardan gösterebiliyor ve böylece oldukça gerçekçi dijital ikizler elde edebiliyor.

Chisel: Yapı ve stili ayıran 3D editör

Marble’ın deneysel aracı Chisel, kullanıcıların önce kaba bir 3D yerleşim (duvarlar, kutular, düzlemler gibi) inşa etmesine, ardından metin komutları ile bu iskeletin görsel stilini tanımlamasına izin veriyor. Böylece mekânın yapısı ile tarzı birbirinden ayrılıyor; tıpkı bir web sitesinde HTML’in iskeleti, CSS’in ise görsel katmanı belirlemesi gibi.

Marble girişten çıkışa üretim hattı
Marble, metin, görüntü ve video girdilerinden indirilebilir 3D sahneler üretiyor.

Johnson, Chisel’in avantajını şöyle anlatıyor: “Koltuk olarak tanımladığım 3D bloğu alıp bir anda başka bir köşeye taşıyabiliyorum. Yani sadece metinle değil, doğrudan nesneleri manipüle ederek düzenleme yapabiliyorsunuz.”

Dünyayı genişletme ve birleştirme

Marble, sahne üretiminden sonra dünyayı genişletme imkânı da sunuyor. Kullanıcı, bir bölgeye ilerlediğinde detaylar bozulmaya başlıyorsa modeli o noktadan itibaren dünyayı büyütmesi için yeniden çalıştırabiliyor; böylece o alan daha zengin ve tutarlı hale geliyor.

Daha da büyük alanlar için “composer mode” devreye giriyor. Bu modda, farklı dünyalar tek bir büyük ortamda birleştirilebiliyor. Örneğin, peynirden yapılmış bir oda ile uzayda geçen futuristik bir toplantı odası, tek bir kesintisiz evrende buluşturulabiliyor.

Marble Chisel ile kaba 3D iskelet ve stil ayrımı
Chisel, mekânın yapısını ve görsel stilini birbirinden ayırarak daha hassas kontrol sağlıyor.

Mekânsal zekâya giden yol

Marble ile oluşturulmuş uzay gemisi ortamı
Marble ile metin komutlarından oluşturulan uzay gemisi ortamında ışık yansımaları fiziksel olarak tutarlı görünüyor.

Marble, dört farklı abonelik katmanı ile sunuluyor:

  • Free: Metin, görsel veya panoramadan 4 sahne üretimi
  • Standard – 20$/ay: 12 sahne üretimi, çoklu görüntü/video girişi ve gelişmiş düzenleme araçları
  • Pro – 35$/ay: 25 sahne üretimi, dünya genişletme özelliği ve ticari kullanım hakları
  • Max – 95$/ay: Tüm özellikler ve 75 sahne üretimi

Johnson, Marble’ın ilk etapta özellikle oyun geliştirme, film ve dizi görsel efektleri (VFX) ile sanal gerçeklik (VR) projelerinde kullanılacağını öngörüyor.

Oyun, VFX ve VR için yeni iş akışları

Oyun dünyasında arka plan üreticisi

Son yıllarda yapılan çeşitli anketler, oyun geliştiricilerinin önemli bir bölümünün üretken yapay zekânın sektöre etkileri konusunda temkinli olduğunu gösteriyor. Fikri mülkiyet ihlali, enerji tüketimi ve yapay zekâ içeriklerinin kaliteyi düşürmesi gibi kaygılar ön planda. Ayrıca bazı büyük stüdyolarda, iş gücü tasarrufu için yapay zekâ tabanlı araçların daha fazla kullanıldığı da biliniyor.

Johnson’a göre Marble, bu kaygıların tamamını hedefleyen bir “tam otomasyon” aracı değil. Aksine, oyun stüdyolarının arka plan ortamları ve ambiyans sahneleri üretip, bunları Unity veya Unreal Engine gibi motorlara varlık (asset) olarak aktarmasını kolaylaştırıyor. Etkileşim, oynanış mekaniği ve kod tarafı ise yine geliştiricilerin kontrolünde kalıyor.

VFX ve sinema için tutarlı kamera kontrolü

Video üreten yapay zekâ modelleri sıklıkla tutarsız kareler ve zayıf kamera kontrolü nedeniyle eleştiriliyor. Johnson, Marble’ın bu noktada avantaj sağladığını; çünkü temelde 3D sahne ürettiği için sanatçıların kamerayı diledikleri gibi konumlandırıp kare hassasiyetinde çalışabildiğini belirtiyor.

VR içerik açığını kapatma hedefi

World Labs, önceliğini VR sektörüne vermese de, Johnson sektörün hâlen içerik açısından aç olduğunu ve Marble’ın burada ciddi ilgi çektiğini ifade ediyor. Üretilen her dünya, bugün itibarıyla VR’de görüntülenebiliyor ve Vision Pro ile Quest 3 başlıklarıyla uyumlu çalışıyor.

Robotik ve simülasyon alanında potansiyel

Robotik alanında, gerçek dünyadan toplanmış yüksek hacimli ve etiketli veri setleri bulmak zor. Johnson, Marble gibi jeneratif dünya modelleri sayesinde, robotlar için simüle edilmiş eğitim ortamları üretmenin çok daha kolaylaşabileceğini savunuyor.

Fei-Fei Li: “Gerçek zekâ, mekânı anlamadan tamamlanamaz”

World Labs CEO’su ve kurucu ortağı Fei-Fei Li, yakın zamanda yayımladığı bir metinde Marble’ı “gerçek anlamda mekânsal zekâya sahip dünya modellerine atılan ilk adım” olarak tanımlıyor.

Li’ye göre, büyük dil modelleri makineleri okumayı ve yazmayı öğrenmeye yaklaştırdıysa, Marble gibi sistemler de onların görmeyi ve inşa etmeyi öğrenmesine yardımcı olabilir. Nesnelerin üç boyutlu uzayda nasıl var olduğunu ve etkileştiğini anlayabilen makineler; oyun ve robotik alanlarının ötesinde, bilim ve tıp gibi disiplinlerde de yeni atılımlar sağlayabilir.

Li, bu vizyonu şu düşünceyle özetliyor: “Gerçekten zeki makineler hayalimiz, mekânsal zekâ olmadan tamamlanamayacak.”

World EDU Türkçe Editör

General Editor - Soru ve Eleştirileriniz için İLETİŞİM kısmından bağlantı kurabilirsiniz.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu