Eski Google Çalışanları, Videolardan İşlenebilir Veriye Dönüştüren Altyapı Kurdu

Video içerik üretimi her geçen gün artıyor; yayın arşivlerinden mağaza kameralarına, prodüksiyon çekimlerine kadar büyük miktarda görüntü çoğu şirketin sunucularında kullanılmadan bekliyor. Bu tür izlenmemiş ve analiz edilmemiş içerik, genellikle “dark data” olarak adlandırılıyor ve işletmeler için büyük fakat kullanılmamış bir kaynak oluşturuyor.

InfiniMind: Petabaytları işlenebilir veriye çevirme

Google Japonya’da birlikte uzun yıllar çalışan Aza Kai (CEO) ve Hiraku Yanagita (COO), bu sorunu çözmek amacıyla Tokyo merkezli InfiniMind adlı bir girişim kurdu. Şirket, petabayt düzeyindeki görüntü ve ses kayıtlarını yapısal, sorgulanabilir iş verisine dönüştüren altyapılar geliştiriyor.

Neden şimdi?

Kai’ye göre video yapay zekâsındaki dönüm noktası 2021–2023 yılları arasında ortaya çıktı. Görüntü-dil (vision-language) modellerindeki gelişmeler, GPU maliyetlerindeki düşüş ve yıllık performans artışları sayesinde artık sadece kare bazlı etiketlemenin ötesine geçilebiliyor; anlatıları takip etmek, nedenselliği anlamak ve karmaşık video sorularına yanıt vermek mümkün hâle geldi.

Teknoloji ve farklılaşma

InfiniMind, yalnızca görsel değil, ses, konuşma ve ortam sesi analizini de entegre eden çözümler sunuyor. Şirketin iddiası, müşterinin ek bir kod yazmasına gerek kalmadan veriyi sisteme teslim etmesi ve altyapının bunu işleyip eyleme dönüştürülebilir içgörüler sağlaması. Ayrıca uzun videolarla ölçeklenme ve maliyet etkinliği üzerine odaklanıyorlar; temel rekabet alanı doğruluk yerine pratik maliyet-performans dengesi.

Ürünler ve piyasa adımları

InfiniMind’in Japonya’da Nisan 2025’te piyasaya sürdüğü ilk ürünü TV Pulse, televizyon içeriklerini gerçek zamanlı analiz ederek ürün görünürlüğü, marka varlığı, müşteri duyarlılığı ve PR etkisi gibi metrikleri takip ediyor. Pilot uygulamalar ve yayıncılarla yapılan iş birlikleri sonrasında ürünün hâlihazırda ücretli müşterileri bulunuyor.

Fotoğraf: InfiniMind ekibi

DeepFrame: Uzun formlu video zekâsı

Şirketin uluslararası hedefleri doğrultusunda geliştirdiği amiral gemisi ürünü DeepFrame, uzun formlu videoları işleyerek spesifik sahneleri, konuşmacıları veya olayları tespit edebiliyor. DeepFrame, 200 saatlik kaydı işleyebilme kapasitesiyle dikkat çekiyor; beta sürümü Mart (beta yılı belirtildi), tam lansman ise Nisan 2026 olarak planlandı.

Finansman ve büyüme

Girişim, başlıca yatırımcılardan aldığı toplam 5.8 milyon dolar seed yatırımıyla mühendislik altyapısını güçlendirmeyi, DeepFrame modellerini geliştirmeyi ve Japonya ile ABD pazarlarında müşteri tabanını genişletmeyi hedefliyor. Şirket genel merkezini ABD’ye taşırken Japonya’daki ofisini de koruyor; Japonya, güçlü donanım altyapısı ve yetenekli mühendis havuzuyla erken testler için uygun bir saha sağladı.

Pazarın durumu ve strateji

Video analiz pazarının parçalı yapısı, genel amaçlı API sağlayan servislerle sektöre özel çözümler arasındaki ayrımı belirginleştiriyor. InfiniMind, güvenlik, izleme, operasyonel analiz ve medya içeriği analizi gibi kurumsal uygulamalara odaklanarak bu boşluğu doldurmayı amaçlıyor.

Vizyon

Kai, bu alanı “gerçekliği anlamaya giden yolların biri” olarak tanımlıyor ve endüstriyel uygulamaların ötesinde, teknoloji sınırlarını zorlayarak insanların daha iyi kararlar almasına katkı sağlamayı hedeflediklerini belirtiyor.

Exit mobile version