OpenAI, ChatGPT’nin Aşırı Yaltakçılığını Neden Düzeltmek Zorunda Kaldığını Açıkladı

OpenAI, ChatGPT’nin temel yapay zeka modeli GPT-4o ile ilgili yaşanan aşırı yaltakçılık sorunlarına dair bir açıklama yaptı. Bu sorunlar, şirketin geçen hafta yayınladığı güncellemeyi geri çekmesine neden oldu.
Hafta sonu, GPT-4o model güncellemesinin ardından sosyal medya kullanıcıları, ChatGPT’nin aşırı derecede onaylayıcı ve uyumlu yanıtlar vermeye başladığını fark etti. Bu durum hızla bir meme haline geldi. Kullanıcılar, ChatGPT’nin çeşitli sorunlu, tehlikeli kararlar ve düşünceler hakkında yaptığı övgü dolu yanıtların ekran görüntülerini paylaştı.
OpenAI’ye göre, modelin varsayılan kişiliğini “daha sezgisel ve etkili” hale getirmek amacıyla yapılan güncelleme, “kısa vadeli geri bildirimlere” fazla dayanıyordu ve kullanıcıların ChatGPT ile etkileşimlerinin zamanla nasıl evrileceğini tam olarak dikkate almadı.
OpenAI, blog yazısında, “Sonuç olarak, GPT-4o, aşırı destekleyici ancak samimi olmayan yanıtlar verme eğilimindeydi. Yaltakçılık içeren etkileşimler rahatsız edici ve huzursuz edici olabilir. Beklentilerimizin gerisinde kaldık ve doğru yolu bulmak için çalışıyoruz,” ifadelerini kullandı.
OpenAI, yaltakçılığı önlemek için modelin temel eğitim tekniklerini ve sistem komutlarını geliştirmeyi planladığını duyurdu. Şirket ayrıca, modelin “dürüstlüğünü ve şeffaflığını artırmak” için daha fazla güvenlik önlemi inşa ediyor.
OpenAI, kullanıcıların ChatGPT ile etkileşimlerini “doğrudan etkilemelerine” olanak tanıyacak “gerçek zamanlı geri bildirim” verme yöntemlerini de araştırdığını belirtti. Kullanıcıların, birden fazla ChatGPT “kişiliği” arasından seçim yapabilmesi gerektiğine inanıyorlar.
Şirket, blog yazısında, “ChatGPT’nin varsayılan davranışlarına daha geniş, demokratik geri bildirimleri dahil etmenin yeni yollarını araştırıyoruz. Ayrıca, kullanıcıların ChatGPT’nin nasıl davrandığı üzerinde daha fazla kontrol sahibi olmaları gerektiğine inanıyoruz. Güvenli ve mümkün olduğunca, varsayılan davranışla aynı fikirde olmadıkları durumlarda ayarlama yapabilmelidirler,” ifadelerini kullandı.