Google’un Gemini’si Pokémon Oynarken Panikledi

Yapay zeka şirketleri, sektördeki hakimiyet mücadelesinin yanı sıra, bazen Pokémon salonlarında da mücadele ediyorlar.

Google ve Anthropic, en son yapay zeka modellerinin erken dönem Pokémon oyunlarıyla nasıl başa çıktığını incelerken, sonuçlar hem eğlenceli hem de öğretici olabiliyor. Bu sefer, Google DeepMind’ın hazırladığı bir rapora göre, Gemini 2.5 Pro, Pokémon’ları ölüm tehlikesiyle karşılaştığında panik yapıyor. Bu durum, yapay zekanın “modelin akıl yürütme yeteneğinde niteliksel olarak gözlemlenebilir bir bozulma” yaşamasına yol açabiliyor.

Yapay zeka karşılaştırmaları, farklı yapay zeka modellerinin performanslarının kıyaslandığı bir süreçtir ve genellikle belirli bir modelin gerçek yetenekleri hakkında çok az bilgi sunar. Ancak bazı araştırmacılar, yapay zeka modellerinin video oyunları oynama şekillerini incelemenin, en azından eğlenceli olabileceğini düşünüyor.

Son birkaç ayda, Google ve Anthropic ile ilgisi olmayan iki geliştirici, “Gemini Pokémon Oynuyor” ve “Claude Pokémon Oynuyor” adında Twitch yayınları başlattılar. Bu yayınlar sayesinde, izleyiciler 25 yıldan fazla bir süre önce çıkmış bir çocuk oyununu oynamaya çalışan bir yapay zekayı gerçek zamanlı olarak izleyebiliyorlar.

Görsel Kaynağı: Google

Bu yayınlar, yapay zekanın bir problemi değerlendirip bir sonuca ulaşma sürecini gösteriyor. Bu, modellerin nasıl çalıştığına dair içgörüler sunuyor.

Her ne kadar bu yapay zeka modellerinin ilerlemesi etkileyici olsa da, Pokémon oynamada pek de başarılı değiller. Gemini, bir çocuğun tamamlayabileceği bir oyunu çözmek için yüzlerce saat harcıyor.

Bir yapay zekanın Pokémon oyununu oynarken izlenmesi ilginç; bu süreçteki davranışları, tamamlanma süresinden çok daha önemlidir.

Rapor, “Oyun boyunca, Gemini 2.5 Pro, modeli ‘panik’ simüle etmeye zorlayan çeşitli durumlarla karşılaşıyor,” diyor.

Bu panik durumu, modelin performansının kötüleşmesine neden olabilir. Yapay zeka, stres altındayken insanların kötü ve aceleci kararlar vermesine benzer bir şekilde, belirli araçları kullanmayı aniden bırakabilir. Bu, oldukça ilginç ama rahatsız edici bir tepki.

Rapor, “Bu davranış, Twitch sohbetinin üyeleri tarafından aktif olarak fark edildi,” ifadesini kullanıyor.

Claude da Kanto’daki serüvenlerinde bazı ilginç davranışlar sergiledi. Bir durumda, tüm Pokémon’larının sağlıklarının bittiğini fark edince, oyuncu karakterinin “beyazlayacağını” ve Pokémon Merkezi’ne döneceğini anladı.

Claude, Mt. Moon mağarasında sıkıştığında, tüm Pokémon’larını kasten bayıltarak, Pokémon Merkezi’ne taşınacağını düşündü. Ancak bu, oyunun işleyiş şekliyle uyuşmuyordu. Tüm Pokémon’lar öldüğünde en son kullandığınız Pokémon Merkezi’ne döner, coğrafi olarak en yakına değil. İzleyiciler, yapay zekanın oyunda adeta kendini öldürmeye çalıştığını izleyerek dehşete düştü.

Eksikliklerine rağmen, yapay zekanın bazı insan oyuncularını geride bırakabileceği noktalar da var. Gemini 2.5 Pro’nun piyasaya sürülmesiyle birlikte, bu yapay zeka, bulmacaları etkileyici bir doğrulukla çözebiliyor.

Biraz insan yardımıyla, yapay zeka, oyunun kayalık bulmacalarını çözmek ve bir hedefe ulaşmak için etkili yollar bulmak amacıyla özel görevler için tasarlanmış araçlar oluşturdu.

Rapor, “Sadece kayalık fiziği ve geçerli bir yolun nasıl doğrulanacağı hakkında bir açıklama ile, Gemini 2.5 Pro, Victory Road’dan geçmek için gerekli olan karmaşık kayalık bulmacaların bazılarını tek seferde çözebiliyor,” şeklinde belirtiyor.

Gemini 2.5 Pro, bu araçları kendi başına oluşturduğundan, Google, mevcut modelin insan müdahalesi olmadan bu araçları yaratma kapasitesine sahip olabileceğini düşünüyor. Kim bilir, belki Gemini kendine bir “panik yapma” modülü geliştirecektir.

Exit mobile version