Yapay zeka yarışında yeni perde: Gemini ivme kazanırken DeepSeek V3.2 serisini sahaya sürdü
Yapay zeka alanındaki küresel rekabet, Google’ın yeni nesil modeli Gemini 3 ve Çin merkezli DeepSeek cephesinden gelen son hamlelerle daha da sertleşiyor. Gemini 3’ün kısa sürede yakaladığı ivme, ChatGPT geliştiricisi OpenAI’ın kullanıcı kaybetmesine yol açarken, DeepSeek de akıl yürütme ve planlama odaklı yeni modelleriyle yarışa ağırlık koyuyor.
Gemini 3, ChatGPT kullanıcılarını kaydırdı
Teknoloji sektöründe büyük ilgi gören Gemini 3, piyasaya çıkışının ardından kısa sürede kullanıcı tabanını genişletti. Kullanıcıların performansını övgüyle değerlendirdiği model, rakip firma OpenAI’ın müşterilerinin yaklaşık yüzde 6’sını kaybetmesine neden oldu. Bu gelişme, ChatGPT cephesinde adeta bir ‘kırmızı alarm’ etkisi yarattı.
DeepSeek’ten V3.2 ve V3.2-Speciale hamlesi
Öte yandan bu yılın başında düşük maliyetli ama güçlü yapay zeka çözümleriyle adından söz ettiren DeepSeek, rekabete yeni bir adım daha attı. Şirket bu hafta, akıl yürütme ve planlama kapasitesine odaklanan iki yeni modeli V3.2 ve V3.2-Speciale’i duyurdu.
Bu adım, DeepSeek’in yalnızca metin üreten sohbet botlarından ziyade, arama motorları, yazılım araçları ve farklı uygulamaları kullanarak somut görevleri yerine getirebilen ajan-tarzı sistemlere yöneldiğinin göstergesi olarak değerlendiriliyor. Her iki model de şirketin daha önceki deneysel çalışmalarının geliştirilmiş versiyonları niteliğinde.
V3.2: Hızlı ve yapılandırılmış düşünme
DeepSeek’e göre V3.2, araç kullanımına “yapılandırılmış düşünme” yeteneği kazandırıyor. Model, biri daha hızlı, diğeri ise daha derin düşünme odaklı olmak üzere iki farklı modda çalışabiliyor ve geniş ölçekli eğitim veri setleri üretebiliyor. Bu sayede binlerce göreve yayılan testlerde daha kapsamlı ve güvenilir doğrulama yapılabildiği belirtiliyor.
V3.2-Speciale: Zorlu mantık ve yarışma görevleri için
V3.2-Speciale ise daha ağır mantık yürütme gerektiren, yarışma tarzı karmaşık görevler için tasarlandı. DeepSeek, bu özel sürümün performansının bazı üst seviye kapalı (tescilli) modellerle yarıştığını savunuyor. Modelin kullandığı Sparse Attention (aralıklı dikkat) yöntemi, özellikle uzun ve karmaşık girdilerde işlem maliyetini belirgin şekilde azaltıyor.
Bu iki modelin çıkışı, OpenAI, Anthropic, Alibaba, Tencent ve Moonshot gibi rakiplerin hızlanan atılımları nedeniyle DeepSeek üzerindeki baskının arttığı bir döneme denk geldi. Şirket ise yeni serinin, daha düşük bütçelere rağmen rakiplerle arasındaki yetenek farkını kapattığını iddia ediyor.
Sparse Attention: Uzun metinlerde düşük maliyetli mimari
Sparse Attention, büyük dil modellerinin uzun metinleri işlerken karşılaştığı yüksek hesaplama maliyetini azaltmak için kullanılan bir dikkat tekniği olarak öne çıkıyor.
Klasik “full attention” yaklaşımında model, bir metindeki her kelimeyi diğer tüm kelimelerle karşılaştırıyor. Metin uzadıkça bu işlem üstel biçimde büyüyor ve hem maliyeti hem de gerekli donanım gücünü ciddi biçimde artırıyor.
Sparse Attention ise bu yoğun bağlantı ağını seyrelterek sadece en kritik kelimeler, bölgeler veya örüntüler arasındaki ilişkileri dikkate alıyor. Böylece model, tüm bağlantıları hesaplamak yerine sınırlı ama daha anlamlı bir alt kümeye odaklanıyor. Sonuç olarak hem hesaplama yükü hem de bellek kullanımı düşerken, uzun metinlerde hız ve doğruluk arasında daha dengeli bir performans elde ediliyor.
Bu mimari; uzun belge işleme, kod çözümleme, araştırma görevleri ve ajan-tarzı planlama gibi uzun bağlam gerektiren alanlarda kritik rol oynuyor. Sparse Attention yalnızca DeepSeek’e özgü bir yöntem olmasa da şirket, uzun bağlam kapasitesini ucuzlatan temel tekniklerden biri olarak bunu özellikle vurguluyor.
DeepSeek, yıl başından bu yana, az sayıda GPU ve daha düşük maliyetle yüksek hesaplama gücü sağlamasıyla tanınan bir yapay zeka ailesi haline geldi.
DeepSeek V3.2 serisinin öne çıkan yetenekleri
DeepSeek, V3.2 ailesiyle şu iddiaları öne sürüyor:
- V3.2 ile GPT-5 seviyesine yakın genel performans
- V3.2-Speciale ile Gemini 3 Pro düzeyinde mantık ve problem çözme kabiliyeti
- Uluslararası matematik ve yazılım yarışmaları gibi zorlu testlerde yüksek başarı oranı
- Uzun girdilerde maliyeti düşüren Sparse Attention mimarisi
- Yalnızca metin üretmeyip dış araçları kullanabilen ajan-tarzı planlama yeteneği
R1 sonrası merak konusu: R2 akıl yürütme modeli
DeepSeek, 20 Ocak 2025’teki çıkışıyla yapay zeka ekosisteminde ciddi bir kırılma yaratmıştı. Açık kaynak ve açık ağırlık (OS/OW) modellerindeki başarısı, Çin’deki pek çok büyük laboratuvarı benzer yapıda modeller geliştirmeye yöneltti. Bu başarının merkezinde, az kaynakla ileri seviye performans sunan R1 modeli bulunuyordu.
Sektörde asıl merak edilen ise şirketin üzerinde çalıştığı yeni R2 akıl yürütme modeli. Modelin henüz piyasaya çıkmamış olmasının ardında, yetersiz hesaplama kaynağı gibi nedenlerin bulunduğu dile getiriliyor. Buna karşın, DeepSeek’in yakında resmi bir duyuru yapması bekleniyor ve R2’nin gelişiyle performans rekabetinde yeni bir turun başlayacağı öngörülüyor.
DeepSeek’in yanı sıra Alibaba, Tencent, Moonshot AI, Zhipu AI gibi aktörlerin OS/OW tabanlı modelleri, Çin’de kamu kurumlarından özel sektöre kadar geniş bir yelpazede kullanılmaya başladı. Bu eğilimin, ülkenin yapay zeka stratejisi kapsamında 2026’da daha da güçlenmesi bekleniyor.
ABD, Çin yapay zeka modellerini daha yakından izliyor
ABD hükümetinin Çin menşeli yapay zeka modellerine yönelik endişeleri giderek artıyor. Sızdırılan bazı Beyaz Saray belgeleri, Washington yönetiminin yalnızca DeepSeek’i değil, diğer Çinli OS/OW modellerini de daha sıkı biçimde incelemeye hazırlandığını gösteriyor.
Güvenlik alanında çalışan Exiger ve CrowdStrike gibi kuruluşlardan, Çinli şirketler hakkında askeri bağlantı iddiaları içeren yeni raporların gelmeye devam edeceği tahmin ediliyor.
GPU savaşı: İhracat kısıtlamaları ve yeni donanım arayışı
2025 boyunca, ABD’nin Çin’e yönelik GPU (grafik işlemci birimi) çip satışlarını hangi koşullarda sınırlayacağı yoğun biçimde tartışıldı. 2026’da da benzer tartışmaların süreceği öngörülüyor.
ABD Başkanı Donald Trump, Nvidia’nın H200 Hopper dönemi GPU’sunun Çin’e ihracatına onay verme seçeneğini değerlendiriyor. Beyaz Saray’ın yapay zeka ekibinden David Sacks ve Nvidia CEO’su Jensen Huang, ihracatta kuşak bazlı esnek bir model öneriyor: Buna göre, şimdilik Hopper GPU’lara izin verilirken, daha yeni nesil Blackwell, Rubin ve Feynman GPU’larının ihracatı ertelenebilir.
Öte yandan Çinli şirketlerin, hâlâ yurt dışındaki veri merkezlerinde bulunan gelişmiş GPU’lara erişebildiği, bu erişimin 2026’da daha da genişleyebileceği belirtiliyor. Nvidia GB200/300 ve bazı AMD GPU modelleri için Orta Doğu’daki veri merkezlerine verilen sınırlı lisanslar, ABD Ticaret Bakanlığı’nın yeni bir düzenleyici çerçeve üzerinde çalıştığına işaret ediyor.
Bu süreçte hem ABD hem de Çin tarafında sürekli dalgalanmalar yaşanması bekleniyor. ABD Adalet Bakanlığı’nın geçen ay bazı kişileri A100 GPU kaçakçılığı suçlamasıyla tutuklaması, miktarlar görece düşük olsa da uyarı niteliğinde bir adım olarak yorumlanıyor.
2026’ya girilirken, Çinli model geliştiricilerin Nvidia dışı alternatif donanımlara yönelme eğiliminin güçleneceği de öngörülüyor. Huawei, Moore Threads, Biren, Enflame gibi yerli üreticilerin GPU çözümleri, Çin’in yapay zeka donanımında dışa bağımlılığını azaltma hedefi doğrultusunda hız kazanıyor.

