Anthropic üç Çinli labı suçluyor
Anthropic, DeepSeek, Moonshot AI ve MiniMax adlı üç Çinli yapay zeka şirketinin, Claude modelinden faydalanmak amacıyla 24.000’den fazla sahte hesap oluşturduğunu ve bu hesaplar aracılığıyla 16 milyondan fazla etkileşim kaydettiğini açıkladı. Şirket, bu faaliyetlerin distillation adı verilen bir yöntemle kendi modellerini geliştirmeye yönelik olduğunu belirtiyor.
Hangi yetenekler hedeflendi?
Anthropic’e göre saldırılar özellikle Claude’un ayırt edici özelliklerini hedef aldı: agentic reasoning (akıllı ajan davranışı), tool use (araç kullanımı) ve kodlama.
Şirketlere göre etkileşim dağılımı
- DeepSeek: Yaklaşık 150.000’in üzerinde etkileşim; özellikle temel mantık ve hizalama konularında veri çıkarmaya odaklandı.
- Moonshot AI: 3,4 milyondan fazla etkileşim; agentic reasoning, araç kullanımı, kodlama, veri analizi ve bilgisayar görüsü alanlarını hedef aldı.
- MiniMax: Yaklaşık 13 milyon etkileşim; agentic coding, tool use ve orkestrasyon yeteneklerini hedef aldı. Anthropic, MiniMax’in yeni Claude sürümüne trafiğinin önemli kısmını yönlendirdiğini gözlemlediğini belirtiyor.
Distillation nedir, neden sorun?
Distillation, araştırma ekiplerinin daha küçük ve ucuz modeller üretmek için sıklıkla başvurduğu bir eğitim yöntemidir. Ancak rakipler bu yöntemi, başkalarının büyük modellerinin davranışlarını ve yeteneklerini hızlıca kopyalamak için kullanabiliyor. Anthropic, söz konusu kötüye kullanımın hem rekabeti zedelediğini hem de güvenlik korumalarını ortadan kaldırma riski taşıdığını vurguluyor.
Çip ihracatı ve güvenlik tartışması
Anthropic, bu ölçekli ekstraksiyon faaliyetlerinin ileri düzey işlemci erişimi gerektirdiğini savunuyor ve bunun da çip ihracatı kısıtlamalarının önemini desteklediğini belirtiyor. ABD tarafında çip ihracatı kurallarının gevşetilmesi tartışmaları sürerken, şirketler ve uzmanlar bu tür distillation saldırılarının yetenek yayılımını hızlandırabileceğini ve ulusal güvenlik risklerini artırabileceğini söylüyor.
Endişeler ve çağrı
Anthropic, distillation saldırılarını daha zorlaştıracak ve tespit etmeyi kolaylaştıracak savunmalara yatırım yapacağını duyurdu. Ayrıca sektör, bulut sağlayıcıları ve politika yapıcılar arasında koordineli bir yanıt çağrısında bulundu. Güvenlik uzmanları da benzer şekilde, sınırlandırılmamış model kopyalamanın teknoloji transferini hızlandırıp tehlikeli yeteneklerin korunmasız şekilde yayılmasına yol açabileceği uyarısında bulunuyor.
Şirketlerden bazılarına yorum için ulaşılamadığı bildirildi.