Anthropic, Opus 4.5 ile Chrome ve Excel Entegrasyonlarını Tanıttı

Geçtiğimiz pazartesi günü, Anthropic, amiral gemisi modeli Opus 4.5’i tanıttı. Bu sürüm, Anthropic’in 4.5 serisinin son üyesi olarak, Eylül ayında lanse edilen Sonnet 4.5 ve Ekim ayında tanıtılan Haiku 4.5’in ardından geldi.
Yeni versiyon, kodlama benchmark’ları (SWE-Bench ve Terminal-bench), araç kullanımı (tau2-bench ve MCP Atlas) ve genel problem çözme (ARC-AGI 2, GPQA Diamond) dahil olmak üzere birçok benchmark’ta son derece etkileyici bir performans sergiliyor.
Özellikle, Opus 4.5, SWE-Bench onaylı olarak %80’in üzerinde bir puan alarak bu alandaki ilk model olma özelliğini taşıyor.
Anthropic, Opus’un bilgisayar kullanımı ve hesap tablosu yeteneklerini vurguladı ve modelin bu ayarları nasıl yönettiğini sergilemek amacıyla birçok paralel ürün başlattı. Opus 4.5 ile birlikte, daha önce pilot aşamasında olan Claude for Chrome ve Claude for Excel ürünleri geniş bir kullanıcı kitlesine sunulacak. Chrome uzantısı tüm Max kullanıcılarına, Excel odaklı model ise Max, Team ve Enterprise kullanıcılarına sunulacak.
Opus 4.5, uzun bağlamlı işlemler için hafıza iyileştirmeleri ile birlikte geliyor; bu da modelin hafızasını yönetme şeklinde önemli değişiklikler gerektiriyor.
Dianne Na Penn, Anthropic’in araştırma ürün yönetimi başkanı, TechCrunch’a yaptığı açıklamada, “Opus 4.5 ile genel uzun bağlam kalitesinde geliştirmeler yaptık, ancak bağlam pencereleri tek başına yeterli olmayacak.” dedi. “Hafızada doğru detayların ne zaman tutulacağını bilmek, daha uzun bir bağlam penceresine sahip olmanın yanı sıra gerçekten önemlidir.”
Bu değişiklikler, ücretli Claude kullanıcıları için uzun zamandır beklenen “sonsuz sohbet” özelliğini de mümkün kıldı. Bu özellik, model bağlam penceresine ulaştığında sohbetlerin kesintiye uğramadan devam etmesini sağlayacak. Model, kullanıcıyı uyarmadan bağlam hafızasını sıkıştıracak.
Geliştirmelerin çoğu, Opus’un bir grup Haiku destekli alt ajanı yönlendirdiği senaryolar gibi etkin kullanım durumlarına yönelik yapıldı. Bu görevleri yönetmek, çalışma hafızasında güçlü bir hakimiyet gerektiriyor ve bu noktada Penn’in belirttiği hafıza iyileştirmeleri gerçekten değerini gösteriyor.
Penn, “İşte burada hafıza gibi temeller gerçekten önemli hale geliyor,” diyor. “Claude, kod tabanlarını ve büyük belgeleri keşfedebilmelidir ve ne zaman geriye dönüp bir şeyi kontrol etmesi gerektiğini de bilmelidir.”
Opus 4.5, 12 Kasım’da piyasaya sürülecek olan OpenAI’nin GPT 5.1 ve 18 Kasım’da tanıtılacak olan Google’ın Gemini 3’ü gibi diğer yeni nesil modellerle yoğun bir rekabetle karşılaşacak.







