Lemon Slice, tek fotoğraftan çalışan 20 milyar parametrelik avatar modeli için 10,5 milyon dolar yatırım aldı
Özet
AI sohbet botları ve ajanlar metin tabanlı deneyimde yaygınlaşırken, Lemon Slice bu etkileşime video avatarları eklemeyi hedefliyor. Şirket, tek bir fotoğraftan dijital avatar üretebilen yeni difüzyon modeli Lemon Slice-2 ile sohbetlere görsel ve konuşma katmanı getiriyor.
Modelin yetenekleri
Lemon Slice-2, tek bir görselden hareketle farklı roller üstlenebilen avatarlar oluşturabiliyor: müşteri hizmetleri, eğitim desteği, dil öğrenimi veya ruh sağlığı desteği gibi senaryolarda kullanılabiliyor. Şirket modelin 20 milyar parametreye sahip olduğunu ve tek bir GPU üzerinde 20 kare/saniye canlı yayın (live-stream) yapabildiğini söylüyor.
Entegrasyon ve özelleştirme
Model, geliştiricilerin ve şirketlerin kullanması için bir API ve tek satırlık kodla yerleştirilebilen bir gömülebilir widget olarak sunuluyor. Bir avatar oluşturulduktan sonra arka plan, stil ve görünüm anında değiştirilebiliyor. İnsan benzeri avatarların yanı sıra, farklı ihtiyaçlara uygun insan dışı karakterler üretme üzerine de çalışılıyor; ses üretimi için dışa dönük ses teknolojileri kullanılıyor.
Güvenlik ve içerik denetimi
Şirket, izinsiz yüz veya ses klonlamayı önlemeye yönelik güvenlik önlemleri uyguladığını ve içerik denetimi için büyük dil modellerinden yararlandığını belirtiyor. Bu sayede kötüye kullanım risklerini azaltmayı hedefliyorlar.
Yatırım ve kullanım alanları
Lemon Slice, çalışmalarını finanse etmek üzere yatırımcılardan 10,5 milyon dolar toplayarak bir tohum turu gerçekleştirdi. Yatırımcılar arasında girişim sermayesi firmaları ve teknoloji liderleri ile sanatçı/etkinlik aktörleri bulunuyor. Şirket, teknolojisini şu alanlarda kullanılmak üzere test ediyor: eğitim, dil öğrenimi, e-ticaret ve kurumsal eğitim.
Rekabet ve strateji
Sektörde D-ID, HeyGen, Synthesia gibi video üretim girişimleri ile Genies, Soul Machine, Praktika ve AvatarOS gibi avatar odaklı oyuncular bulunuyor. Lemon Slice, kendi genel amaçlı difüzyon modelini kullanarak avatar yaratımında ölçeklenebilirlik ve genel amaçlılık sağlayacağını iddia ediyor; kurucu ekip, mevcut avatar çözümlerinin etkileşimde yapay veya rahatsız edici bir his verdiğini ve bunun yaygın benimsenmeyi engellediğini belirtiyor.
Kurucu ekip, teknoloji ve planlar
2024’te kurulan şirketin kurucu ortakları, modelin etkileşimli videoda uzun vadede benimsenmesi gerektiğini düşünüyor. Ekip şu anda sekiz kişi ve yeni yatırımla mühendislik, pazara giriş ekipleri ile hesaplanan eğitim maliyetleri ve hesaplama (compute) giderlerini karşılamayı planlıyor.
Gelecek hedefleri
Lemon Slice, amaç olarak avatarların “uncanny valley” (tuhaflık) sorununu aşmasını ve etkileşimli video aracılığıyla bilgi aktarımını daha doğal hale getirmeyi öne koyuyor. Tek görselle yeni bir yüz eklemeye izin veren ve hem insan hem insan-dışı yüzlerde çalışabilen genel amaçlı bir model yaklaşıyor; şirket bunun sektör içindeki farklı niş çözümler karşısında avantaj sağlayacağını savunuyor.







