OpenAI GPT-5 Tanıtıldı: ChatGPT’nin Yeni Dönemi Başladı
OpenAI, amiral gemisi GPT-5 modelini tanıttı ve bunun ChatGPT’nin varsayılan modeli olarak kullanıma sunulduğunu duyurdu. Yeni mimari, o-serisinin akıl yürütme yeteneklerini, GPT serisinin hızlı yanıt verme özellikleriyle birleştirerek, sohbetten çok görevleri tamamlayan bir “ajan” davranışına yöneliyor.
Şirket, GPT-5’in yalnızca yanıt üretmekle kalmadığını, aynı zamanda kullanıcı adına uygulama geliştirme, takvim yönetme ve kapsamlı araştırma brifleri hazırlama gibi görevleri de yerine getirdiğini belirtiyor. Model, gerçek zamanlı yönlendirme yeteneği sayesinde, gerektiğinde hızlı yanıtlar verirken, daha karmaşık durumlar için uzun düşünme süreleri ayırabiliyor.
Sohbetten Ajana Geçiş Vizyonu
OpenAI CEO’su Sam Altman, GPT-5’i “dünyanın en iyi modeli” olarak tanımlıyor ve bunu AGI (Genel Yapay Zeka) hedefine yönelik önemli bir adım olarak görüyor. Vizyon, kullanıcıların daha az ayar yaparak sonuç odaklı bir deneyim yaşamalarını sağlamak.
Kullanıma Sunum ve Abonelikler
GPT-5, bugün itibarıyla ücretsiz ChatGPT kullanıcılarına açılıyor. Plus aboneleri daha yüksek kota, Pro aboneleri ise sınırsız erişim ve ek kaynaklarla birlikte GPT-5 Pro’ya sahip olabilecek. Kurumsal (Team, Edu, Enterprise) müşteriler için model gelecek hafta varsayılan hale gelecek.
Performans: Kodlama Alanında Öne Çıkıyor
OpenAI, GPT-5’in kodlama alanında sınırları zorladığını vurguluyor. SWE-bench Verified testinde elde ettiği %74,9 başarı ile Claude Opus 4.1’in %74,5’lik ve Gemini 2.5 Pro’nun %59,6’lık skorlarını geride bırakıyor. Ayrıca, “vibe coding” adı verilen sıfırdan uygulama geliştirme senaryolarında da dikkat çekiyor.

Zorlu Testlerde Dengeli Tablo
“Humanity’s Last Exam” testinde GPT-5 Pro (araçlarla) %42 skor alırken, xAI’in Grok 4 Heavy modeli %44,4 ile öne geçiyor. GPQA Diamond testinde ise GPT-5 Pro, %89,4’lük başarısıyla Claude Opus 4.1’in %80,9’unu ve Grok 4 Heavy’nin %88,9’unu geçmeyi başarıyor. Özetle, bazı alanlarda lider konumda, bazı alanlarda ise denk bir performans sergiliyor.
Halüsinasyon Oranında Ciddi Düşüş
Sağlık odaklı HealthBench Hard Hallucinations testinde, “düşünmeli” modda GPT-5’in halüsinasyon oranı %1,6’ya geriledi. Bu seviye, önceki GPT-4o ve o3 modellerindeki çift haneli oranların çok altında. Genel sohbet testlerinde de yanlış yanıt oranı %4,8 seviyesine inmiş görünüyor.
Güvenlik ve Dürüstlük
OpenAI, GPT-5’in aldatma eğilimlerinin düşük olduğunu ve zararlı kullanımla masum talepleri ayırt etme konusunda daha yetkin olduğunu vurguluyor. Bu sayede tehlikeli taleplere karşı daha kararlı bir red, makul isteklere karşı ise daha az gereksiz reddetme hedefleniyor.
Tüketici Deneyiminde Yenilikler
ChatGPT’ye Cynic, Robot, Listener ve Nerd isimli dört yeni kişilik ekleniyor; bu profiller, talimat gerekmeksizin istenen üsluba uyum sağlıyor. GPT-5’in “düşünme” yetisi, soruya bağlı olarak hız ile derinlik arasında otomatik bir denge kuruyor.
Geliştiriciler için API ve Fiyatlama
GPT-5, API’de üç boyutta sunuluyor: gpt-5, gpt-5-mini ve gpt-5-nano. Geliştiriciler, yanıt uzunluğunu (verbosity) kontrol edebiliyor. Temel modelin maliyeti $1,25/M giriş token’ı ve $10/M çıkış token’ı olarak açıklanıyor; bu da daha erişilebilir bir eşik hedefliyor.
Açık Ağırlık ve Rekabet Bağlamı
Lansman haftasında OpenAI, indirilebilir açık ağırlıklı gpt-oss modelini de tanıttı; bu model, önceki o3 ve o4-mini’ye benzer bir performans sunarken, GPT-5 özellikle kodlama gibi alanlarda standartları yükseltmeyi hedefliyor. Ancak birçok metrikte rakiplerle başa baş bir tablo mevcut; gerçek fark ise geliştiricilerin ve kullanıcıların sahadaki deneyimiyle belirlenecek.







