Microsoft, yan kuruluşu GitHub ve iş ortağı OpenAI , şirketlerin yapay zeka destekli kodlama asistanı GitHub Copilot'u "benzeri görülmemiş bir ölçekte yazılım korsanlığına" dayandığını iddia eden bir toplu davada hedef alındı. Dava henüz ilk aşamalarında, ancak şirketlerin telif hakkıyla korunan veriler üzerinde servet eğitim yazılımı yaptığı daha geniş AI dünyası üzerinde büyük bir etkisi olabilir.
Haziran 2021'de Microsoft'a ait GitHub tarafından tanıtılan Copilot, web'den alınan ve çoğu herkesin kodu yaratıcılarına kredi vermek için yeniden kullanmasını gerektiren lisanslarla yayınlanan halka açık kod havuzlarında eğitildi. Yardımcı pilotun, lisanslı kodun uzun bölümlerini kredi vermeden kustuğunu tespit etti – şirketleri telif hakkı yasasını büyük ölçüde ihlal etmekle suçlayan bu davaya yol açtı.
"Bu, ABD'de yapay zeka sistemlerinin eğitimine ve çıktısına meydan okuyan ilk toplu davadır. Son olmayacak."
San Francisco merkezli Joseph Saveri Hukuk Bürosu'nun yardımıyla dava açan programcı ve avukat Matthew Buterick, yaptığı basın açıklamasında, "GitHub Copilot'un yasallığına meydan okuyoruz" dedi. “Bu, uzun bir yolculuğun ilk adımı. Bildiğimiz kadarıyla bu, ABD'de yapay zeka sistemlerinin eğitimine ve çıktısına meydan okuyan ilk toplu davadır. Son olmayacak. AI sistemleri yasadan muaf değildir. Bu sistemleri yaratan ve işletenler hesap vermeli.”
Geçen Cuma günü açılan dava, ilk aşamalarında. Özellikle, mahkeme, zarar gördüğü iddia edilen programcılar sınıfını henüz onaylamadı. Ancak The Verge ile konuşan Butterick ve Joseph Saveri Hukuk Bürosu'ndan avukatlar Travis Manfredi ve Cadio Zirpoli, davanın daha geniş üretken AI dünyası üzerinde büyük bir etkisi olmasını beklediklerini söylediler.
Microsoft ve OpenAI, AI sistemlerini kâr için eğitmek için telif hakkıyla korunan materyalleri web'den kazıma konusunda yalnız değil. Açık kaynak programı Stable Diffusion gibi birçok metinden görüntüye yapay zeka tam olarak aynı şekilde oluşturuldu. Bu programların arkasındaki firmalar, bu verilerin kullanımlarının ABD'de adil kullanım doktrini kapsamında olduğu konusunda ısrar ediyor. Ancak hukuk uzmanları, bunun yerleşik hukuktan uzak olduğunu ve Butterick'in toplu dava davası gibi davaların, belirsiz bir şekilde tanımlanmış statükoyu altüst edebileceğini söylüyor.
Davanın arkasındaki motivasyonlar ve mantık hakkında daha fazla bilgi edinmek için, neden yapay zekanın Napster çağında olduğumuzu düşündüklerini ve neden izin vermediklerini açıklayan Buterick (MB), Manfredi (TM) ve Zirpolil (CZ) ile konuştuk. Microsoft, başkalarının kodunu atıfta bulunmadan kullanmak, açık kaynak hareketini öldürebilir.
Bir yorum talebine yanıt olarak GitHub şunları söyledi: “Başından beri Copilot ile sorumlu bir şekilde yenilik yapmaya kararlıyız ve ürünü dünya çapındaki geliştiricilere en iyi hizmeti verecek şekilde geliştirmeye devam edeceğiz.” OpenAI ve Microsoft, yayın sırasında benzer taleplere yanıt vermemişti.
Bu röportaj netlik ve kısalık için düzenlendi
İlk olarak, bu teknolojinin savunucusu olan insanlardan biraz AI topluluğunun tepkisinden bahsetmek istiyorum. Bu vakaya yönelik bir tepkinin temsilcisi olduğunu düşündüğüm bir yorum buldum, "Butterick'in buradaki amacı, kaynak kodu veya resimler gibi verilerin dönüştürücü ML kullanımını sonsuza kadar ortadan kaldırmaktır."
Bunun hakkında ne düşünüyorsun Matthew? Amacınız bu mu? Değilse, nedir?
“AI sistemleri, yasadan muaf olan sihirli kara kutular değildir.”
Matthew Buterick: Bence bu gerçekten basit. Yapay zeka sistemleri, kanundan muaf sihirli kara kutular değildir ve sorumlu bir yapay zekaya sahip olmamızın tek yolu, herkes için adil ve etik olmasıdır. Dolayısıyla bu sistemlerin sahiplerinin hesap verebilir kalması gerekiyor. Bu, bütün kumaştan yaptığımız ve sadece yapay zekaya uyguladığımız bir ilke değil. Gıda, ilaç veya ulaşım olsun, her türlü ürüne uyguladığımız aynı ilkedir.
Bazen yapay zeka topluluğundan aldığınız tepkilerin – ve harika araştırmacılarla, harika düşünürlerle uğraşıyorsunuz – bu düzenleme ve güvenlik alanında çalışmaya alışkın olmadıklarını hissediyorum. Düzenleme, inovasyonun arkasından hareket ettiğinden, teknolojide her zaman bir zorluktur. Ama arada, bunun gibi davalar bu boşluğu dolduruyor. Bu, bir toplu dava davasının konusunun bir parçasıdır: bu fikirleri test etmek ve netlik yaratmaya başlamak.
Davanızda başarılı olursanız, bu alandaki inovasyon, üretken AI modellerinin oluşturulması üzerinde yıkıcı bir etkisi olacağını düşünüyor musunuz?
Korsanlığın inovasyonu körüklediği Butterick, üretken yapay zekanın Napster çağındayız, diyor
MB: Umarım tam tersidir. Bence teknolojide, yasaların sınırlarının ötesine geçen ürünlerin çıktığını defalarca görüyoruz, ama sonra birileri geliyor ve bunu yapmanın daha iyi bir yolunu buluyor. 2000'lerin başında herkesin sevdiği ama tamamen yasa dışı olan Napster'ınız vardı. Ve bugün Spotify ve iTunes gibi şeyler var. Ve bu sistemler nasıl ortaya çıktı? Lisans anlaşmaları yapan ve içeriği yasal olarak getiren şirketler tarafından. Tüm paydaşlar masaya geldi ve çalışmasını sağladı ve AI için benzer bir şeyin olamayacağı fikri benim için biraz felaket. Yakın zamanda Shutterstock'un görüntüleri eğitimde [üretken AI] kullanılan insanlar için bir Katkıda Bulunanlar Fonu kurduğuna dair bir duyuru gördük ve belki bu, diğer eğitimlerin nasıl yapıldığına dair bir model haline gelebilir. Ben, Spotify ve iTunes'u daha çok tercih ederim ve bu yapay zeka araçlarının yeni neslinin herkes için daha iyi ve daha adil olmasını ve herkesi daha mutlu ve daha üretken hale getirmesini umuyorum.
Microsoft ve OpenAI'den bir anlaşmayı kabul etmeyeceğinizi cevaplarınızdan anlıyorum.
MB: [ Gülüyor ] Davanın sadece ilk günü…
Davanın özellikle ilginç olduğunu düşündüğüm bir bölümü, Microsoft ve OpenAI arasındaki çok yakın ama belirsiz bir şekilde tanımlanmış iş ilişkisiyle ilgiliydi. 2016'da OpenAI'nin büyük ölçekli deneylerini Microsoft'un bulutunda çalıştıracağını, Microsoft'un belirli OpenAI ürünleri için özel lisanslara sahip olduğunu ve Microsoft'un OpenAI'ye bir milyar dolar yatırım yaparak onu hem OpenAI'nin en büyük yatırımcısı hem de hizmet sağlayıcısı haline getirdiğini söylediniz. . Bu ilişkinin önemi nedir ve neden bunu vurgulamanız gerektiğini hissettiniz?
Travis Manfredi: Microsoft'un sorumluluktan kaçınmak için bir kalkan olarak algılanan faydalı bir OpenAI olarak kullanmaya çalıştığını söyleyebilirim. Muhtemelen öyle olmasa da, adil kullanım için araştırmayı bu kâr amacı gütmeyen kuruluş aracılığıyla filtrelemeye çalışıyorlar. Bu yüzden OpenAI'nin başladığı her neyse, artık o olmadığını göstermek istiyoruz. Kar amaçlı bir iş. İşi yatırımcılarına para kazandırmaktır. Kâr amacı gütmeyen bir [OpenAI Inc.] tarafından kontrol edilebilir, ancak bu kâr amacı gütmeyen kuruluşun yönetim kurulunun tamamı iş adamlarıdır. Niyetlerinin ne olduğunu bilmiyoruz. Ancak OpenAI'nin orijinal misyonunu takip ediyor gibi görünmüyor. Bu nedenle, bunun Microsoft, OpenAI ve GitHub arasında ortak bir plan olduğunu ve onların inanmamızı istedikleri kadar yararlı veya özgecil olmadığını göstermek istedik ve umarım keşif bu konuda daha fazla bilgi verir.
Microsoft, GitHub, OpenAI ve sektördeki üretken AI modelleri oluşturan diğer oyuncuların diğer kişilerin verilerini bu şekilde kullanmaya devam etmesine izin verilirse ne olacağından korkuyorsunuz?
TM: Sonuç olarak, açık kaynak lisanslarının tamamen sonu olabilir. Çünkü şirketler lisanslarınıza saygı göstermeyeceklerse, onu kodunuza koymanın ne anlamı var? Yakalanıp herhangi bir atıfta bulunmadan geri tükürecekse? Açık kaynak kodunun insanlık ve teknoloji dünyası için son derece faydalı olduğunu düşünüyoruz ve kodlamayı anlamayan ve yalnızca olasılık tahminleri yapabilen yapay zekanın inovasyondan daha iyi olduğunu düşünmüyoruz. insan kodlayıcıların sunabileceği
“Biri gelir ve 'Maliyetleri sosyalleştirelim, kârı özelleştirelim' diyor.”
MB: Evet, bunun gerçekten açık kaynak için varoluşsal bir tehdit olduğunu düşünüyorum. Ve belki de sadece benim kuşağım, ama internette çalışan güzel, özgür bir topluluk olduğunda yeterince durum gördüm ve birisi gelip “Hadi maliyetleri sosyalleştirelim ve kârları özelleştirelim” diyor.
Kodu yaratıcılardan ayırırsanız, bu ne anlama gelir? Sana bir örnek vereyim. Avrupa'da bir mühendisle konuştum, "İlişkilendirme benim için gerçekten çok önemli çünkü tüm müşterilerimi bu şekilde elde ediyorum. Açık kaynaklı yazılımlar yapıyorum; insanlar paketlerimi kullanıyor, üzerinde adımı görüyor ve benimle iletişime geçiyor ve onlara daha fazla mühendislik veya destek satıyorum.” "Eğer atıfımı çıkarırsan kariyerim biter ve aileme bakamam, yaşayamam" dedi. Ve bunun birçok programcı için iyi huylu bir sorun olmadığını gerçekten eve getiriyor.
Ancak, Copilot gibi araçların geleceğin olduğu ve genel olarak kodlayıcılar için daha iyi oldukları konusunda yapılması gereken bir durum olduğunu düşünüyor musunuz?
MB: Yapay zekayı seviyorum ve bu makinelere bizim yaptığımız gibi akıl yürütmeyi öğretebileceğimiz bir bilgisayarla oynayan sekiz yaşımdan beri hayalimdi ve bence bu gerçekten ilginç ve harika bir alan. . Ancak sadece Napster örneğine geri dönebilirim: [bu sistemler] sadece ilk adımdır ve insanlar Napster'ın ne kadar harika olduğunu düşünürse düşünsün, aynı zamanda tamamen yasa dışıdır ve herkesi bir araya getirerek çok daha iyisini yaptık. masaya ve herkes için adil hale getirmek.
Peki, uygulandığını görmek istediğiniz bir çare nedir? Bazı insanlar iyi bir çözüm olmadığını, eğitim veri kümelerinin çok büyük olduğunu, AI modellerinin gerçekten ilişkilendirmeyi izlemek ve kredi vermek için çok karmaşık olduğunu iddia ediyor. Bunun hakkında ne düşünüyorsun?
Cadio Zirpoli: Yapay zekalarını lisanslara saygılı ve atıf sağlayan bir şekilde eğittiklerini görmek istiyoruz. Dışarıdaki sohbet panolarında, bunu devre dışı bırakmak veya katılmak istemeyen ancak ellerini havaya kaldırıp "çok zor, o yüzden bırakın Microsoft ne isterse yapsın" demenin yolları olabileceğini gördüm. yaşamak istediğimiz bir çözüm değil.
Sizce bu dava, diğer üretken yapay zeka ortamlarında bir öncelik oluşturabilir mi? Metinden görüntüye yapay zekada, örneğin OpenAI dahil olmak üzere şirketlerin telif hakkıyla korunan görüntüleri uygun izin olmadan kullandıklarına dair benzer şikayetler görüyoruz.
CZ: Daha basit cevap evet.
TM: DMCA, telif hakkıyla korunan her türlü materyal için eşit olarak geçerlidir ve resimler genellikle atıf içerir; sanatçılar, çalışmalarını çevrimiçi olarak yayınladıklarında, genellikle bir telif hakkı bildirimi veya bir yaratıcı ortak lisans içerir ve bunlar da görüntü oluşturucular [yaratan şirketler] tarafından göz ardı edilir.
Peki bu davadan sonra ne olacak? Bu davanın devam etmesi için size toplu dava statüsü verilmesi gerektiğine inanıyorum. Sizce bu hangi zaman diliminde olabilir?
CZ: Microsoft'un davamızı reddetmek için bir hareket getirmesini bekliyoruz. Başarılı olacağımıza ve davanın devam edeceğine inanıyoruz. Bir keşif dönemine gireceğiz ve ardından klas sertifikası için mahkemeyi hareket ettireceğiz. Bunun zamanlaması farklı mahkemelere ve farklı yargıçlara göre büyük ölçüde değişebilir, bu yüzden görmemiz gerekecek. Ancak bizler değerli bir davaya sahip olduğumuza ve sadece görevden alma talebini aşmakla kalmayıp, sınıfımızı belgelendirme konusunda da başarılı olacağımıza inanıyoruz.