'in lansmanı ile işletmelere yapay zeka metinden görüntü oluşturma olanağı sunuyor
OpenAI, genel beta sürümünde bir API lansmanı ile görüntü oluşturma yazılımı DALL-E'yi işletmeler için çok daha yaygın bir şekilde kullanılabilir hale getiriyor. API, şirketlerin ürünlerine DALL-E'nin metinden görüntüye işlevselliğini eklemelerini kolaylaştıracak ve geliştiricilere yazılımı kendi beğenilerine göre entegre etmeleri ve özelleştirmeleri için basitleştirilmiş araçlar sunacak.
API için erken bir kullanım örneği, yazılımı Office kullanıcıları için PowerPoint slaytlarından ev ödevi için resimlere kadar görüntüler oluşturmak üzere kullanan Microsoft Designer uygulamasıdır . Microsoft, OpenAI'nin en büyük yatırımcılarından biri ve geçen ay uygulamayı tanıttı.
OpenAI'de API üzerinde çalışan bir ürün müdürü olan Luke Miller, The Verge'e şirketin geliştiricilerin DALL-E için bulacağı yeni uygulamaları görmekten heyecan duyduğunu söyledi.
Miller, “Zaten bunu çok ilginç şekillerde geliştiren birkaç müşterimiz var” dedi. "Bazıları yaratıcı keşifler, bazıları daha iş odaklı." Miller, ev dekorasyonu için posterler ve sanat eserleri oluşturmak üzere API'yi kullanan Mixtiles adlı bir startup ve müşterilerin kendi kıyafetlerini tasarlamalarına yardımcı olmak için onu kullanan CALA adlı bir başka girişimin örneğini verdi. “İnsanların ortaya çıkardığı yaratıcı fikirleri görmek her zaman ilham vericidir” dedi.
OpenAI, yazılımlarına daha kolay erişim sağlayan rakipleriyle rekabet ediyor
Metinden görüntüye yapay zekaya ilgi ve benimsenme geçen yıl patladı ve bir zamanlar alanın açık lideri olan OpenAI, Midjourney ve Stability AI gibi yeni gelenler tarafından zorlandı. Bu kuruluşlar, kullanıcılara daha az kısıtlama getirerek, yapay zeka sistemlerini çok az gözetimle geliştirmelerine izin verdi. Bu arada, Google ve Meta gibi bu alandaki diğer oyuncular çok daha temkinli bir yaklaşım benimsediler: benzer yeteneklere sahip sistemler geliştirmek, ancak genel kullanımlarını çok sınırlı senaryolarla sınırlamak .
Metinden görüntüye yapay zekanın sunduğu bariz yaratıcı faydaların yanı sıra çeşitli tehlikeler de var. Yazılım, rıza dışı çıplak fotoğraflar gibi yanlış bilgiler ve zararlı görüntüler oluşturmak için kullanılabilir (OpenAI, anahtar kelime filtreleri aracılığıyla yazılımının bu tür kullanımlarını zorlaştırsa da) ve veri kullanımıyla ilgili zorlu etik sorular vardır.
DALL-E gibi metinden görüntüye yapay zeka sistemleri, genellikle fotoğrafçıların, sanatçıların ve tasarımcıların telif hakkıyla korunan çalışmalarını içeren web'den alınan görüntüler üzerinde eğitilir. Pek çok sanatçı, ortaya çıkan teknolojinin yalnızca kendi bireysel tarzlarını taklit etmek için kullanılabileceğine değil, aynı zamanda OpenAI gibi milyarlarca dolarlık şirketler için gelir elde etmek için çalışmalarının kullanımı için tazmin edilmediğine de kızgın.
Metinden görüntüye uygulamalar geliştiren bazı firmalar tazminat sunmaya başlıyor. Örneğin, katılımcı verilerini DALL-E'yi oluşturmak için OpenAI'ye lisanslayan ve özel stok görüntüleri oluşturmak için API'sini kullanan Shutterstock, yakın zamanda, çalışmaları AI'yı eğitmek için kullanılan kişilere tazmin etmek için bir Katkıda Bulunanlar Fonu kurduğunu duyurdu.
OpenAI'nin sanatçıları telafi etmek için benzer bir plan yapmayı planlayıp planlamadığı sorulduğunda Miller, şirketin işlerinde somut bir şey olmadığını söyledi. Miller, “Şu anda bununla ilgili paylaşacak özel bir şeyim yok” dedi. “Açıkçası bu, topluluktan geri bildirim almaya devam ettiğimiz bir şey. Bu, birçok farklı açıdan düşünülmesi çok karmaşık bir soru. Topluluktan ve neye değer verdiklerini öğrenmek istiyoruz.”
Şirket, DALL-E'yi oluşturmak için hangi eğitim verilerinin kullanıldığını (Shutterstock'tan görüntü lisanslamasının ötesinde) hiçbir zaman paylaşmadığından, OpenAI ile soruyu yanıtlamak daha da zor. Hukuk uzmanları, telif hakkıyla korunanları bile olsa kamuya açık görüntüleri kazıyarak AI modellerinin eğitilmesinin ABD'deki adil kullanım doktrini kapsamında olacağını öne sürüyor. Ancak birçok sanatçının belirttiği gibi, yeterli yasal koruma, etik onaylama ile aynı şey değildir.
OpenAI, şirket sistemlerini çalıştırdıkça DALL-E API'sine erişimin başlangıçta hız sınırlı olacağını ve müşterilerin teknolojiyi nasıl kullandıklarına dair inceleme yapmayacağını söylüyor. (Yine, DALL-E'nin filtreleri, çıplaklık, vahşet ve politik açıdan hassas malzeme içeren belirli görüntülerin oluşturulmasını sınırlandırmaktadır.) Müşteriler, oluşturulan görüntü başına ücretlendirilecek ve üç çözünürlük katmanı arasından seçim yapabilecektir. 256 x 256 görüntünün parça başı 0,016 ABD dolarına mal olur; 512 x 512 görüntünün parça başı 0,018 ABD doları olacaktır; ve 1024 x 1024 görüntülerin her biri 0,02 USD olacaktır.