OpenAI, O3-Pro ile AI Akıl Yürütme Modelinde Yeni Bir Dönem Başlatıyor

OpenAI, o3-pro adlı yeni AI modelini duyurdu; bu model, şirketin şimdiye kadar geliştirdiği en yetenekli model olarak tanıtılıyor.

O3-pro, OpenAI’nın bu yılın başında piyasaya sürdüğü o3 akıl yürütme modelinin geliştirilmiş bir versiyonudur. Geleneksel AI modellerinin aksine, akıl yürütme modelleri sorunları adım adım çözerek, fizik, matematik ve kodlama gibi alanlarda daha güvenilir bir performans sergilemelerini sağlıyor.

O3-pro, Salı gününden itibaren ChatGPT Pro ve Team kullanıcıları için mevcut olacak ve o1-pro modelinin yerini alacak. Kurumsal ve Eğitim kullanıcıları ise bir hafta sonra bu modele erişim sağlayacak. Ayrıca, O3-pro, OpenAI’nın geliştirici API’sinde de aktif durumda.

O3-pro’nun fiyatı, API’de milyon başına 20 dolar giriş token’i ve 80 dolar çıkış token’i olarak belirlenmiştir. Giriş token’leri modele beslenen verileri, çıkış token’leri ise modelin bu verilerden ürettiği çıktıları temsil eder.

Bir milyon giriş token’i, yaklaşık 750,000 kelimeye eşdeğerdir; bu, “Savaş ve Barış” romanından biraz daha uzundur.

OpenAI, O3-pro’nun, her test edilen kategoride o3’ten daha fazla tercih edildiğini ve özellikle bilim, eğitim, programlama, iş ve yazım yardımı gibi önemli alanlarda daha yüksek puan aldığını belirtiyor. Ayrıca, O3-pro, açıklık, kapsam, talimat takip etme ve doğruluk açısından da daha yüksek bir değerlendirme almış durumda.

OpenAI’ya göre, O3-pro, web’de arama yapma, dosyaları analiz etme, görsel girdiler üzerinde akıl yürütme, Python kullanma, hafızasını kullanarak yanıtlarını kişiselleştirme gibi birçok araca erişim sağlıyor. Ancak, modelin yanıtlarının genellikle o1-pro‘a kıyasla daha uzun sürdüğü belirtiliyor.

O3-pro’nun bazı sınırlamaları da mevcut. Şu anda ChatGPT’deki geçici sohbetler devre dışı bırakılmış durumda ve OpenAI, bununla ilgili bir teknik sorunu çözmeye çalışıyor. O3-pro, görüntü üretemiyor ve OpenAI’nın AI destekli çalışma alanı özelliği olan Canvas’ı desteklemiyor.

Öte yandan, O3-pro, OpenAI’nın iç testlerine göre popüler AI benchmark’larında etkileyici sonuçlar elde ediyor. 2024 AIME testinde, O3-pro, Google’ın en iyi performans gösteren AI modeli olan Gemini 2.5 Pro‘dan daha iyi puan alıyor. Ayrıca O3-pro, PhD seviyesindeki bilim bilgisi testi olan GPQA Diamond’da, Anthropic’ın yakın zamanda duyurduğu Claude 4 Opus‘u da geride bırakıyor.

Exit mobile version