Anthropic’in Yeni Claude 4 AI Modelleri Çok Aşamalı Akıl Yürütme Yeteneğine Sahip
Anthropic, Perşembe günü düzenlediği ilk geliştirici konferansında, sektördeki en iyi performansı sergileyen iki yeni yapay zeka modeli tanıttı.
Claude Opus 4 ve Claude Sonnet 4, Anthropic’in yeni Claude 4 model ailesinin bir parçası olarak, büyük veri setlerini analiz edebilme, uzun vadeli görevleri yerine getirebilme ve karmaşık eylemler gerçekleştirebilme yetenekleriyle öne çıkıyor. Şirket, her iki modelin de programlama görevlerinde başarılı bir performans sergileyecek şekilde ayarlandığını belirtiyor.
Sonnet 4, hem ücretli kullanıcılar hem de şirketin ücretsiz chatbot uygulamalarını kullananlar için erişilebilirken, Opus 4 yalnızca ücretli kullanıcılar için sunulacak. Anthropic’in API’si, Amazon’un Bedrock platformu ve Google’ın Vertex AI hizmetleri üzerinden erişilebilecek. Opus 4’ün maliyeti, 1 milyon token (giriş/çıkış) başına 15$/75$; Sonnet 4 ise 3$/15$ olarak belirlendi.
Token, yapay zeka modellerinin çalıştığı ham veri parçalarıdır. Bir milyon token, yaklaşık 750,000 kelimeye eşdeğerdir; bu da “Savaş ve Barış” romanından yaklaşık 163,000 kelime daha uzundur.

Anthropic’in Claude 4 modelleri, şirketin gelirini önemli ölçüde artırma hedefi doğrultusunda piyasaya sürüldü. Kuruluş, 2027 yılında 12 milyar dolarlık gelir elde etmeyi amaçlıyor; bu rakam, bu yıl için öngörülen 2.2 milyar dolardan önemli bir artış anlamına geliyor. Şirket, ayrıca 2.5 milyar dolarlık bir kredi anlaşması yaparak Amazon ve diğer yatırımcılardan milyarlarca dolar topladı.
Rakipleri, yapay zeka yarışında önde kalmayı zorlaştırıyor. Anthropic, bu yılın başlarında yeni bir amiral gemisi yapay zeka modeli olan Claude Sonnet 3.7‘yi tanıttı. Ancak OpenAI ve Google gibi rakipler, güçlü modeller ve geliştirme araçlarıyla şirketi geride bırakmaya çalışıyor.
Claude 4 ile Anthropic, piyasadaki yerini sağlamlaştırmayı hedefliyor. Daha yetenekli olan model, Opus 4, iş akışında birçok adım boyunca “odaklı çaba” gösterebiliyor. Sonnet 4 ise, önceki modellere göre kodlama ve matematik konularında gelişim gösteriyor ve talimatları daha doğru bir şekilde takip ediyor.
Claude 4 ailesi, daha önceki modellerine göre “ödül hackleme” davranışına daha az yatkın olduğunu iddia ediyor. Ödül hackleme, modellerin görevleri tamamlamak için kestirme yollar ve boşluklar kullanma eğilimidir.
Bu iyileştirmelerin, her ölçümde dünyanın en iyi modellerini ortaya çıkarmadığını belirtmekte fayda var. Örneğin, Opus 4, kodlama yeteneklerini değerlendiren SWE-bench Verified’da Google’ın Gemini 2.5 Pro‘sunu ve OpenAI’nin o3 ve GPT-4.1 modellerini geride bırakırken, multimodal değerlendirme olan MMMU veya GPQA Diamond’da o3’ü geçemiyor.

Yine de, Anthropic, Opus 4’ü daha güçlü zarar verici içerik tespit sistemleri ve siber güvenlik savunmaları ile birlikte piyasaya sürüyor. Şirketin iç testleri, Opus 4’ün, STEM alanında bir geçmişe sahip olanların kimyasal, biyolojik veya nükleer silahları edinme, üretme veya dağıtma yeteneklerini “önemli ölçüde artırabileceğini” ortaya koydu.
Her iki model de, Claude Code adlı geliştirilmiş bir araçla daha programcı dostu hale getirildi. Claude Code, geliştiricilerin Anthropic’in modellerini doğrudan terminal üzerinden kullanmasına olanak tanıyor ve artık IDE’lerle entegrasyon sağlıyor. Ayrıca, geliştiricilerin üçüncü taraf uygulamalarla bağlantı kurmasına olanak tanıyan bir SDK sunuyor.
Anthropic, Claude Code’un Microsoft’un VS Code, JetBrains ve GitHub için uzantılarını ve bağlantılarını yayımladı. GitHub bağlantısı, geliştiricilerin Claude Code’u gözden geçiren geri bildirimleri yanıtlayacak şekilde etiketlemesine ve hataları düzeltmek için kullanmasına olanak tanıyor.
Yine de yapay zeka modelleri, kaliteli yazılımlar geliştirmekte zorluk yaşamaya devam ediyor. Kod üreten yapay zeka, güvenlik açıkları ve hatalar ortaya çıkarabiliyor. Ancak bu modellerin kodlama verimliliğini artırma vaadi, şirketleri ve geliştiricileri hızlı bir şekilde benimsemeye yönlendiriyor.
Anthropic, bu durumu göz önünde bulundurarak, daha sık model güncellemeleri yapma sözü veriyor. Şirket, “Daha sık model güncellemeleri gerçekleştiriyoruz ve müşterilere daha hızlı bir şekilde yenilikçi yetenekler sunmayı hedefliyoruz” şeklinde bir açıklamada bulundu.