Google, dünyanın "en çok konuşulan 1.000 dilini" destekleyen tek bir AI dil modeli geliştirmek için iddialı yeni bir proje duyurdu. Bu hedefe yönelik ilk adım olarak şirket, 400'den fazla dilde eğitilmiş ve “bugün bir konuşma modelinde görülen en geniş dil kapsamı” olarak tanımladığı bir yapay zeka modelini piyasaya sürüyor.
Dil ve yapay zeka, tartışmasız her zaman Google'ın ürünlerinin merkezinde yer aldı, ancak makine öğrenimindeki son gelişmeler – özellikle güçlü, çok işlevli "büyük dil modelleri" veya LLM'lerin geliştirilmesi – bu alanlara yeni bir vurgu yaptı.
Google, bu dil modellerini Google Arama gibi ürünlere entegre etmeye başlarken, sistemlerin işlevselliğiyle ilgili eleştirileri de savuşturdu. Dil modellerinin, ırkçılık ve yabancı düşmanlığı gibi zararlı toplumsal önyargıları yeniden ortaya çıkarma eğilimi ve dili insan duyarlılığıyla ayrıştıramama gibi bir takım kusurları vardır. Google, bu sorunları özetleyen makaleler yayınladıktan sonra kendi araştırmacılarını rezil bir şekilde işten çıkardı .
Bu modeller, dil oluşturmadan ( OpenAI'nin GPT-3'ü gibi) çeviriye kadar birçok görevi yerine getirebilir (bkz. Google'ın “1.000 Dil Girişimi” belirli bir işleve değil, dünya dilleri arasında geniş bilgi birikimine sahip tek bir sistem oluşturmaya odaklanıyor.
The Verge'e konuşan Google AI araştırma başkan yardımcısı Zoubin Ghahramani, şirketin bu boyutta bir model oluşturmanın çevrimiçi alanlarda ve AI eğitim veri kümelerinde yetersiz temsil edilen dillere çeşitli AI işlevlerini getirmeyi kolaylaştıracağına inandığını söyledi ( “Düşük kaynaklı diller” olarak da bilinir).
"Diller organizmalar gibidir, birbirlerinden evrimleşmişlerdir ve bazı benzerlikleri vardır."
Ghahramani, "Birçok farklı dile maruz kalan ve bunlar üzerinde eğitilen tek bir modele sahip olarak, düşük kaynaklı dillerimizde çok daha iyi performans elde ediyoruz" diyor. “1.000 dile ulaşmanın yolu, 1000 farklı model oluşturmak değil. Diller organizmalar gibidir, birbirlerinden evrimleşmişlerdir ve bazı benzerlikleri vardır. Yeni bir dilden gelen verileri 1000 dil modelimize dahil ettiğimizde ve [öğrendiklerini] yüksek kaynaklı bir dilden düşük maliyetli bir dile çevirme becerisine sahip olduğumuzda, sıfır vuruşlu öğrenme dediğimiz şeyde oldukça muhteşem ilerlemeler bulabiliriz. kaynak dil.”
Geçmiş araştırmalar, bu yaklaşımın etkinliğini göstermiştir ve Google'ın planlı modelinin ölçeği, geçmiş çalışmalara göre önemli kazanımlar sunabilir. Bu tür büyük ölçekli projeler, teknoloji şirketlerinin yapay zeka araştırmalarına hükmetme ve bu firmaların büyük miktarlarda bilgi işlem gücü ve eğitim verilerine erişim açısından benzersiz avantajlarından yararlanma tutkularının tipik bir örneği haline geldi. Benzer bir proje, Facebook'un ana şirketi Meta'nın “ evrensel bir konuşma çevirmeni” oluşturmaya yönelik devam eden girişimidir. ”
Yine de, bu kadar çok dilde eğitim verilirken verilere erişim bir sorundur ve Google, 1.000 dilli model üzerinde çalışmayı desteklemek amacıyla, ses kayıtları ve yazılı metinler de dahil olmak üzere düşük kaynaklı diller için veri toplanmasını finanse edeceğini söylüyor. .
Şirket, bu modelin işlevselliğinin nereye uygulanacağına dair doğrudan bir planı olmadığını, yalnızca Google'ın ürünlerinde, Google Translate'den YouTube altyazılarına ve daha fazlasına kadar çeşitli kullanımlara sahip olmasını beklediğini söylüyor.
“Aynı dil modeli, bir robot için komutları koda dönüştürebilir; matematik problemlerini çözebilir; çeviri yapabilir.”
Ghahramani, "Geniş dil modelleri ve genel olarak dil araştırmaları hakkında gerçekten ilginç olan şeylerden biri, çok sayıda farklı görevi yerine getirebilmeleridir" diyor. “Aynı dil modeli, bir robot için komutları koda dönüştürebilir; matematik problemlerini çözebilir; çeviri yapabilir. Dil modelleriyle ilgili gerçekten ilginç olan şey, birçok bilginin depoları haline gelmeleri ve onları farklı şekillerde araştırarak farklı faydalı işlevsellik parçalarına ulaşabilmenizdir.”
Google, yeni AI ürünleri için bir vitrinde 1000 dil modelini duyurdu. Şirket ayrıca metinden videoya modeller hakkında yeni araştırmaları, Wordcraft adlı bir prototip AI yazma asistanı ve kullanıcılara metinden görüntüye gibi az gelişmiş AI modellerine sınırlı erişim sağlayan AI Test Kitchen uygulamasında bir güncelleme paylaştı. modeli Imagen.