Microsoft’un Yeni Phi 4 AI Modeli, Daha Büyük Sistemlerle Rekabet Ediyor

Microsoft, Çarşamba günü birkaç yeni “açık” AI modeli tanıttı. Bu modeller arasında en yetenekli olanı, en az bir benchmarkta OpenAI’ın o3-mini modeliyle rekabet edebiliyor.

Yeni tanıtılan tüm modeller – Phi 4 mini reasoning, Phi 4 reasoning ve Phi 4 reasoning plus – “akıl yürütme” modelleri olarak sınıflandırılıyor. Bu, karmaşık problemleri çözme sürecinde daha fazla zaman harcayarak bilgi doğrulama yapabildikleri anlamına geliyor. Microsoft, bu modelleri bir yıl önce başlattığı Phi “küçük model” ailesinin bir parçası olarak geliştirerek, AI geliştiricilerine uygulama oluşturma temeli sunmayı hedefliyor.

Phi 4 mini reasoning, yaklaşık 1 milyon sentetik matematik problemi üzerinde eğitildi. Bu model, 3.8 milyar parametreye sahip olup, Microsoft’a göre hafif cihazlarda “gömülü öğretim” gibi eğitim uygulamaları için tasarlandı.

Parametreler, bir modelin problem çözme yetenekleriyle doğrudan ilişkilidir; daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.

Phi 4 reasoning ise 14 milyar parametreye sahip bir modeldir ve “yüksek kaliteli” web verileri ile OpenAI’ın o3-mini modelinden alınan “özenle seçilmiş örneklerle” eğitilmiştir. Microsoft, bu modelin matematik, bilim ve kodlama uygulamaları için en uygun olduğunu belirtiyor.

Phi 4 reasoning plus, Microsoft’un daha önce tanıttığı Phi-4 modelinin bir akıl yürütme modeli olarak yeniden uyarlanmış versiyonudur. Bu model, belirli görevlerde daha iyi doğruluk sağlamaktadır. Microsoft, Phi 4 reasoning plus’ın R1 modelinin performans seviyelerine yaklaştığını iddia ediyor; bu modelin ise 671 milyar parametre içerdiği biliniyor. Ayrıca, iç testlerde Phi 4 reasoning plus’ın, bir matematik beceri testi olan OmniMath’te o3-mini ile eşit seviyede performans gösterdiği de belirtiliyor.

Phi 4 mini reasoning, Phi 4 reasoning ve Phi 4 reasoning plus, AI geliştiricileri için Hugging Face platformunda detaylı teknik raporlarla birlikte sunuluyor.

Microsoft, “Distilasyon, pekiştirme öğrenimi ve yüksek kaliteli veriler kullanarak, bu [yeni] modeller boyut ve performans arasında denge sağlıyor.” açıklamasında bulundu. “Bu modeller, düşük gecikme süreli ortamlara uygun olacak kadar küçük ve aynı zamanda daha büyük modellere rakip olabilecek güçlü akıl yürütme yeteneklerine sahip. Bu özellik, kaynak kısıtlaması olan cihazların bile karmaşık akıl yürütme görevlerini verimli bir şekilde gerçekleştirmesine olanak tanıyor.”

Exit mobile version