Teknoloji

DeepSeek: AI Chatbot Uygulaması Hakkında Bilmeniz Gereken Her Şey

DeepSeek, bu hafta viral hale geldi.

Çin merkezli DeepSeek AI laboratuvarı, Apple App Store sıralamalarında en üst sıraya yükselmesinin ardından geniş bir kitle tarafından tanınmaya başladı. DeepSeek’in AI modelleri, verimli hesaplama teknikleri kullanılarak eğitildi ve bu durum, Wall Street analistleri ve teknolojistlerin, ABD’nin AI yarışındaki liderliğini koruyup koruyamayacağını sorgulamalarına neden oldu.

Ancak, DeepSeek nereden geldi ve bu kadar hızlı bir uluslararası üne nasıl kavuştu?

DeepSeek’in Kökenleri

DeepSeek, ticaret kararlarını bilgilendirmek için AI kullanan Çin menşeli High-Flyer Capital Management tarafından destekleniyor.

AI meraklısı Liang Wenfeng, 2015 yılında High-Flyer’ı kurdu. Zhejiang Üniversitesi’nde öğrenci iken ticaretle ilgilenmeye başlayan Wenfeng, 2019 yılında AI algoritmalarını geliştirip uygulamaya odaklanan bir hedge fonu olarak High-Flyer Capital Management’ı kurdu.

2023 yılında High-Flyer, finansal işinden ayrı olarak AI araçları araştırmaya adanmış bir laboratuvar olan DeepSeek’i başlattı. High-Flyer’ın yatırımcılarından biri olarak laboratuvar, kendi şirketi olarak da DeepSeek adıyla faaliyete geçti.

İlk günden itibaren DeepSeek, model eğitimi için kendi veri merkezi kümelerini inşa etti. Ancak, diğer AI şirketleri gibi, ABD ihracat yasaklarından etkilenmeye başladı. Şirket, en son modellerinden birini eğitmek için ABD şirketlerine sunulan H100 çipinin daha az güçlü bir versiyonu olan Nvidia H800 çiplerini kullanmak zorunda kaldı.

DeepSeek’in teknik ekibinin genç olduğu söyleniyor. Şirket, en iyi Çin üniversitelerinden doktora araştırmacılarını agresif bir şekilde işe alıyor. Ayrıca, AI’nın çeşitli konuları daha iyi anlaması için bilgisayar bilimi geçmişi olmayan kişileri de işe alıyor.

DeepSeek’in Güçlü Modelleri

DeepSeek, Kasım 2023’te ilk model setini tanıttı. Ancak, AI endüstrisinin dikkatini çekmesi, DeepSeek-V2 model ailesinin piyasaya sürülmesiyle gerçekleşti. Bu model, metin ve görüntü analizinde genel amaçlı bir sistem olarak çeşitli AI benchmark testlerinde başarılı sonuçlar elde etti ve o dönemdeki benzer modellere göre daha düşük maliyetle çalıştı.

DeepSeek-V2, rakiplerini fiyatlarını düşürmeye zorladı. Aralık 2024’te piyasaya sürülen DeepSeek-V3 ise bu üne daha da katkıda bulundu.

DeepSeek’in iç testlerine göre, DeepSeek V3, Meta’nın Llama gibi açık kaynaklı modellere ve OpenAI’nin API üzerinden erişilebilen kapalı modellere göre daha iyi performans sergiliyor.

DeepSeek’in R1 “akıl yürütme” modeli ise Ocak ayında piyasaya sürüldü ve belirli benchmarklarda OpenAI’nin o1 modeliyle eşit performans gösterdiği iddia ediliyor.

Akıl yürütme modeli olan R1, kendini etkili bir şekilde doğrulayarak güvenilirliği artırıyor. Ancak bu modeller, tipik modellere göre çözüme ulaşmada birkaç saniye ila birkaç dakika daha uzun sürüyor.

DeepSeek V3 ve diğer modellerinin bir dezavantajı ise Çin menşeli olmaları nedeniyle, Çin internet düzenleyicisi tarafından yanıtlarının “temel sosyalist değerleri” yansıtıp yansıtmadığının denetlenmesidir.

Mart ayında, DeepSeek 16.5 milyon ziyaretçi sayısını geçti. Ancak bu, ChatGPT’nin Mart ayında 500 milyon haftalık aktif kullanıcıya ulaşmasının yanında oldukça düşük kalıyor.

Yıkıcı Bir Yaklaşım

DeepSeek’in iş modeli tam olarak net değil. Şirket, ürün ve hizmetlerini piyasa değerinin çok altında fiyatlandırıyor ve bazılarını tamamen ücretsiz sunuyor. Yatırımcı parası almıyor, buna rağmen büyük bir VC ilgisi söz konusu.

DeepSeek, maliyet verimliliği sayesinde büyük bir rekabet avantajı sağladığını iddia ediyor. Ancak bazı uzmanlar bu rakamları sorguluyor.

Geliştiriciler, DeepSeek’in modellerine ilgi gösteriyor. Bu modeller, yaygın anlamda açık kaynak olmasa da, ticari kullanım için izin veren lisanslar altında mevcut.
DeepSeek’in daha büyük ve köklü rakiplerine karşı elde ettiği başarı, AI dünyasında önemli değişimlere yol açtı. Bunun sonucunda Nvidia’nın hisse değerinde %18’lik bir düşüş yaşandı.

Microsoft, DeepSeek’in Azure AI Foundry hizmetinde kullanılabilir olduğunu duyurdu. Bununla birlikte, bazı şirketler ve ülkeler, veri güvenliği endişeleri nedeniyle DeepSeek’i yasaklamış durumda.

DeepSeek’in geleceği belirsizliğini koruyor. Gelişmiş modellerin ortaya çıkması bekleniyor; ancak ABD hükümeti, olumsuz yurt dışı etkilerini artıran bir tutum sergiliyor.

Bu hikaye, 28 Ocak 2025’te yayınlandı ve düzenli olarak güncellenecektir.

World EDU Türkçe Editör

General Editor - Soru ve Eleştirileriniz için İLETİŞİM kısmından bağlantı kurabilirsiniz.

İlgili Makaleler

Bir yanıt yazın

Başa dön tuşu