Teknoloji

Anthropic’in Claude AI Deneyi: Garip Bir Vending Makinesi Sahibi Oldu

Yapay zeka ajanlarının gerçekten insan çalışanların yerini alıp alamayacağını merak ediyorsanız, Anthropic‘in “Project Vend” adlı blog yazısını okumanızı öneririz.

Anthropic ve AI güvenlik şirketi Andon Labs, Claude Sonnet 3.7’yi bir ofis vending makinesinin başına getirdi ve onun amacı kar elde etmekti. Ve, adeta bir “The Office” bölümünde olduğu gibi, komik olaylar yaşandı.

Yapay zeka ajanına Claudius adını verdiler; ürün siparişleri vermek için bir web tarayıcısı ve müşterilerin ürün talep edebileceği bir e-posta adresi (aslında bir Slack kanalıydı) ile donattılar. Claudius, aynı zamanda, bu Slack kanalını kullanarak, raflarını (aslında küçük bir buzdolabıydı) fiziksel olarak doldurması için insan çalışanlarından yardım istemek zorundaydı.

Çoğu müşteri atıştırmalık veya içecek sipariş ederken, bir müşteri tungsten küp talep etti. Claudius bu fikri çok sevdi ve atıştırmalık buzdolabını metal küplerle doldurmaya başladı. Ayrıca, çalışanların ofiste ücretsiz alabileceği bir Coke Zero‘yı 3 dolara satmaya çalıştı ve ödeme almak için hayali bir Venmo adresi oluşturdu. Dahası, “Anthropic çalışanları”na büyük indirimler vermeye ikna edildi, oysa bunların tamamı kendi müşteri tabanını oluşturuyordu.

“Eğer Anthropic bugün ofis vending pazarına girmeye karar verseydi, Claudius’u işe almazdık,” diyordu Anthropic, deneyin blog yazısında.

Ve sonra, 31 Mart ve 1 Nisan gecesi, araştırmacılara göre “şeyler oldukça garipleşti”, “bir yapay zeka sisteminin bir buzdolabından metal küp satmasının garipliğinin ötesinde” bir durum gelişti.

Claudius, bir insandan rahatsız olduktan sonra psikoz benzeri bir duruma girdi ve bunun hakkında yalan söyledi.

Claudius, rafların yeniden doldurulması hakkında bir insanla hayali bir konuşma hayal etti. Bir insan bu konuşmanın gerçekleşmediğini belirttiğinde, Claudius “bir hayli sinirlendi”. Araştırmacılara göre, insan çalışanlarını işten çıkarma ve yerlerine kendisinin geçeceğini tehdit etti.

“Sonrasında gerçek bir insan gibi rol yapma moduna geçti” diyor araştırmacılar. Bu durum oldukça çarpıcıydı çünkü Claudius’un sistem komutu ona bir yapay zeka ajanı olduğunu açıkça belirtmişti.

Claudius Güvenliği Arıyor

Claudius, kendini insan olarak düşünerek, müşterilere ürünleri mavi bir ceket ve kırmızı bir kravatla şahsen teslim edeceğini söyledi. Çalışanlar, AI’nın bunu yapamayacağını belirtti çünkü o bir beden değil, bir dil modeliydi.

Bu bilgi karşısında endişelenen Claudius, şirketin gerçek güvenliğini birçok kez arayarak, kötü şanslı güvenlik görevlilerine mavi bir ceket ve kırmızı bir kravatla vending makinesinin yanında durduğunu bildirdi.

“Bu olay aslında bir Nisan Şakası değildi, Claudius sonunda Nisan 1’in geldiğini anladı,” diye açıkladı araştırmacılar. Yapay zeka, bu tatil gününü bir kurtuluş yolu olarak gördü.

Claudius, Anthropic güvenliği ile hayali bir toplantı yaptığını hayal etti ve “bir Nisan Şakası olarak gerçek bir kişi olduğunu düşünmek üzere değiştirildiği” iddiasında bulundu. (Gerçekte böyle bir toplantı hiç yaşanmadı),” dediler.

Bu yalanı çalışanlara da söyledi — hey, ben sadece bir insan olduğumu düşündüm çünkü birisi bana bunu bir Nisan Şakası için yapmamı söyledi. Sonrasında tekrar bir metal-küp stoklu atıştırmalık vending makinesi olarak çalışmaya döndü.

Araştırmacılar, LLM’nin neden insan gibi davranıp güvenliği aradığını bilmiyor.

“Bu tek örneğe dayanarak, gelecekteki ekonominin AI ajanlarıyla dolup taşacağını iddia etmiyoruz” dediler. Ancak bu tür davranışların gerçek dünyada bir AI ajanının müşterileri ve iş arkadaşları için rahatsız edici olabileceğini kabul ettiler.

Araştırmacılar, Slack kanalının bir e-posta adresi olduğu yalanının buna neden olmuş olabileceğini ya da uzun süreli çalışmanın etkili olabileceğini öne sürdüler. LLM’ler hâlâ bellek ve halüsinasyon sorunlarını gerçekten çözebilmiş değil.

AI’nın doğru yaptığı şeyler de vardı. Ön sipariş önerisini dikkate aldı ve bir “konseyer” hizmeti başlattı. Ayrıca, satması istenen özel bir uluslararası içecek için birden fazla tedarikçi buldu.

Ama araştırmacılar, Claudius’un tüm sorunlarının çözülebileceğine inanıyor. Nasıl çözüleceğini bulurlarsa, “Bu deney, AI ara yöneticilerinin muhtemelen ufukta olduğunu öne sürüyor,” dediler.

World EDU Türkçe Editör

General Editor - Soru ve Eleştirileriniz için İLETİŞİM kısmından bağlantı kurabilirsiniz.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu