Teknoloji

Alibaba, Qwen 3 ile Yeni Bir ‘Hibrit’ AI Modeli Tanıttı

Çinli teknoloji şirketi Alibaba, yeni Qwen 3 model ailesini duyurdu. Şirket, bu modellerin Google ve OpenAI’nin en iyi modelleriyle rekabet edebildiğini ve bazı durumlarda onları geride bıraktığını iddia ediyor.

Qwen 3’ün çoğu modeli, AI geliştirme platformu üzerinden “açık” lisans altında indirilebilir durumda. Modeller, 0.6 milyar parametreden 235 milyar parametreye kadar değişen boyutlara sahip. Parametreler, bir modelin problem çözme yetenekleriyle doğrudan ilişkilidir; daha fazla parametreye sahip modeller, genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.

Qwen gibi Çin kökenli model serilerinin yükselişi, OpenAI gibi Amerikan laboratuvarları üzerinde daha yetenekli AI teknolojileri geliştirme baskısı oluşturdu. Bu durum, Çinli AI şirketlerinin gerekli çipleri elde etme yeteneklerini sınırlamaya yönelik politikaların uygulanmasına da yol açtı.

Alibaba’ya göre, Qwen 3 modelleri “hibrit” yapıda olup, karmaşık problemleri çözme sürecinde düşünme yeteneğine sahip. Bu sayede, kendilerini etkili bir şekilde doğrulama yeteneğine erişiyorlar. Ancak bu durum, daha yüksek bir gecikmeye neden olabiliyor.

Qwen ekibi, blog yazılarında, “Düşünme ve düşünmemek modlarını sorunsuz bir şekilde entegre ettik, kullanıcılara düşünme bütçesini kontrol etme esnekliği sunuyoruz” şeklinde ifade etti. Bu tasarım, kullanıcıların görev odaklı bütçelerini daha kolay ayarlamalarını sağlıyor.

Qwen 3 modelleri, 119 dil destekliyor ve neredeyse 36 trilyon token içeren bir veri seti üzerinde eğitildi. Token, bir modelin işlediği ham veri parçalarıdır; 1 milyon token, yaklaşık 750,000 kelimeye eşittir. Alibaba, Qwen 3’ün ders kitapları, “soru-cevap çiftleri”, kod parçaları ve AI tarafından üretilen veriler gibi çeşitli kaynaklara dayandığını belirtiyor.

Bu yenilikler, Qwen 3’ün önceki versiyonu olan Qwen 2’ye kıyasla önemli ölçüde geliştirilmesine olanak tanıdı. Qwen 3 modelleri, OpenAI’nin o3 ve o4-mini gibi en son modelleri ile karşılaştırıldığında, başı çekmiyor ancak yine de güçlü performans sergiliyorlar.

En büyük Qwen 3 modeli olan Qwen-3-235B-A22B, OpenAI’nin o3-mini’sini ve Google’ın Gemini 2.5 Pro’sunu geride bırakıyor. Ayrıca, AIME gibi zorlu matematik ölçütlerinde ve BFCL testlerinde de o3-mini’yi geçmeyi başarıyor.

Alibaba Qwen 3 benchmarks
Alibaba’nın Qwen 3 için içsel benchmark sonuçları.

En büyük halka açık Qwen 3 modeli olan Qwen3-32B, birçok özel ve açık AI modeli ile rekabet edebilir durumda. Qwen3-32B, OpenAI’nin o1 modeli üzerinde de çeşitli testlerde üstünlük sağlıyor.

Alibaba, Qwen 3’ün araç çağırma yetenekleri, talimatları takip etme ve belirli veri formatlarını kopyalama konularında “üstün” olduğunu belirtiyor. İndirilebilir modellerin yanı sıra, Qwen 3, Fireworks AI ve Hyperbolic gibi bulut sağlayıcıları üzerinden de kullanılabiliyor.

AI bulut hizmeti sağlayıcısı Tuhin Srivastava, Qwen 3’ün açık modellerin kapalı kaynak sistemlerle eş zamanlı olarak geliştiğinin bir göstergesi olduğunu ifade etti. “ABD, Çin’e çip satışlarını ve alımlarını kısıtlama yolunda adımlar atıyor, ancak Qwen 3 gibi son teknoloji açık modeller, kesinlikle yerel olarak kullanılacaktır” dedi. “Bu durum, işletmelerin kendi araçlarını geliştirmeleri ve kapalı model şirketlerinden satın almaları gerçeğini yansıtıyor.”

World EDU Türkçe Editör

General Editor - Soru ve Eleştirileriniz için İLETİŞİM kısmından bağlantı kurabilirsiniz.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu