OpenAI GPT-5 Tanıtıldı: ChatGPT’nin Yeni Dönemi Başladı

OpenAI, amiral gemisi GPT-5 modelini tanıttı ve bunun ChatGPT’nin varsayılan modeli olarak kullanıma sunulduğunu duyurdu. Yeni mimari, o-serisinin akıl yürütme yeteneklerini, GPT serisinin hızlı yanıt verme özellikleriyle birleştirerek, sohbetten çok görevleri tamamlayan bir “ajan” davranışına yöneliyor.

Şirket, GPT-5’in yalnızca yanıt üretmekle kalmadığını, aynı zamanda kullanıcı adına uygulama geliştirme, takvim yönetme ve kapsamlı araştırma brifleri hazırlama gibi görevleri de yerine getirdiğini belirtiyor. Model, gerçek zamanlı yönlendirme yeteneği sayesinde, gerektiğinde hızlı yanıtlar verirken, daha karmaşık durumlar için uzun düşünme süreleri ayırabiliyor.

Sohbetten Ajana Geçiş Vizyonu

OpenAI CEO’su Sam Altman, GPT-5’i “dünyanın en iyi modeli” olarak tanımlıyor ve bunu AGI (Genel Yapay Zeka) hedefine yönelik önemli bir adım olarak görüyor. Vizyon, kullanıcıların daha az ayar yaparak sonuç odaklı bir deneyim yaşamalarını sağlamak.

Kullanıma Sunum ve Abonelikler

GPT-5, bugün itibarıyla ücretsiz ChatGPT kullanıcılarına açılıyor. Plus aboneleri daha yüksek kota, Pro aboneleri ise sınırsız erişim ve ek kaynaklarla birlikte GPT-5 Pro’ya sahip olabilecek. Kurumsal (Team, Edu, Enterprise) müşteriler için model gelecek hafta varsayılan hale gelecek.

Performans: Kodlama Alanında Öne Çıkıyor

OpenAI, GPT-5’in kodlama alanında sınırları zorladığını vurguluyor. SWE-bench Verified testinde elde ettiği %74,9 başarı ile Claude Opus 4.1’in %74,5’lik ve Gemini 2.5 Pro’nun %59,6’lık skorlarını geride bırakıyor. Ayrıca, “vibe coding” adı verilen sıfırdan uygulama geliştirme senaryolarında da dikkat çekiyor.

Zorlu Testlerde Dengeli Tablo

“Humanity’s Last Exam” testinde GPT-5 Pro (araçlarla) %42 skor alırken, xAI’in Grok 4 Heavy modeli %44,4 ile öne geçiyor. GPQA Diamond testinde ise GPT-5 Pro, %89,4’lük başarısıyla Claude Opus 4.1’in %80,9’unu ve Grok 4 Heavy’nin %88,9’unu geçmeyi başarıyor. Özetle, bazı alanlarda lider konumda, bazı alanlarda ise denk bir performans sergiliyor.

Halüsinasyon Oranında Ciddi Düşüş

Sağlık odaklı HealthBench Hard Hallucinations testinde, “düşünmeli” modda GPT-5’in halüsinasyon oranı %1,6’ya geriledi. Bu seviye, önceki GPT-4o ve o3 modellerindeki çift haneli oranların çok altında. Genel sohbet testlerinde de yanlış yanıt oranı %4,8 seviyesine inmiş görünüyor.

Güvenlik ve Dürüstlük

OpenAI, GPT-5’in aldatma eğilimlerinin düşük olduğunu ve zararlı kullanımla masum talepleri ayırt etme konusunda daha yetkin olduğunu vurguluyor. Bu sayede tehlikeli taleplere karşı daha kararlı bir red, makul isteklere karşı ise daha az gereksiz reddetme hedefleniyor.

Tüketici Deneyiminde Yenilikler

ChatGPT’ye Cynic, Robot, Listener ve Nerd isimli dört yeni kişilik ekleniyor; bu profiller, talimat gerekmeksizin istenen üsluba uyum sağlıyor. GPT-5’in “düşünme” yetisi, soruya bağlı olarak hız ile derinlik arasında otomatik bir denge kuruyor.

Geliştiriciler için API ve Fiyatlama

GPT-5, API’de üç boyutta sunuluyor: gpt-5, gpt-5-mini ve gpt-5-nano. Geliştiriciler, yanıt uzunluğunu (verbosity) kontrol edebiliyor. Temel modelin maliyeti $1,25/M giriş token’ı ve $10/M çıkış token’ı olarak açıklanıyor; bu da daha erişilebilir bir eşik hedefliyor.

Açık Ağırlık ve Rekabet Bağlamı

Lansman haftasında OpenAI, indirilebilir açık ağırlıklı gpt-oss modelini de tanıttı; bu model, önceki o3 ve o4-mini’ye benzer bir performans sunarken, GPT-5 özellikle kodlama gibi alanlarda standartları yükseltmeyi hedefliyor. Ancak birçok metrikte rakiplerle başa baş bir tablo mevcut; gerçek fark ise geliştiricilerin ve kullanıcıların sahadaki deneyimiyle belirlenecek.

Exit mobile version