Bu Yapay Zeka Canlı Videoyu Gerçek Zamanlı Olarak Çarpıtıyor

Dean Leitersdorf, Zoom üzerinden kendini tanıtıyor ve ardından bana psikedelik mantar yemişim gibi hissettiren bir komut satırı yazıyor: "vahşi batı, kozmik, Roma İmparatorluğu, altın, su altı." Bu kelimeleri, canlı videoyu gerçek zamanlı olarak işleyen girişimi Decart tarafından geliştirilen bir yapay zeka modeline giriyor.
Leitersdorf gülerek "Ne olacağı hakkında hiçbir fikrim yok" diyor ve kısa bir süre sonra ponçosuyla Julius Caesar'ın tuhaf, altın rengi, su altı versiyonuna dönüşüyor.
Leitersdorf şimdiden biraz vahşi görünüyor; sırtından aşağı dökülen uzun saçları, parmaklarında akrobasi yapan bir kalem. Konuşurken, model her yeni karenin nasıl görünmesi gerektiğini tahmin etmeye çalışırken ekrandaki görüntüsü gerçeküstü şekillerde dalgalanıyor. Leitersdorf ellerini yüzüne koyuyor ve daha kadınsı yüz hatlarına bürünüyor. Kalemi farklı renkler ve şekiller arasında geçiş yapıyor. Bizi yeni psikedelik diyarlara götüren daha fazla ipucu ekliyor.
Decart'ın videodan videoya modeli Mirage , hem etkileyici bir mühendislik başarısı hem de yapay zekanın yakında canlı yayın sektörünü nasıl sarsabileceğinin bir işareti. OpenAI'nin Sora gibi araçlar, metin komutlarıyla giderek daha gerçekçi video görüntüleri üretebiliyor. Mirage artık videoları gerçek zamanlı olarak düzenlemeyi mümkün kılıyor.
Decart, Perşembe günü kullanıcıların kendi videolarını oluşturup YouTube kliplerini düzenlemelerine olanak tanıyan bir web sitesi ve uygulama yayınlıyor. Web sitesi, "anime", "Dubai silüeti", "siberpunk" ve "Versay Sarayı" gibi çeşitli varsayılan temalar sunuyor. Röportajımız sırasında Leitersdorf, Fortnite oynayan birinin videosunu yüklüyor ve sahne, bilindik Battle Royale dünyasından su altında geçen bir versiyona dönüşüyor.
Decart'ın teknolojisi oyun dünyasında büyük bir potansiyele sahip. Şirket, Kasım 2024'te Mirage'a benzer bir yaklaşım kullanarak anında oynanabilir bir Minecraft benzeri dünya oluşturan Oasis adlı bir oyunun demosunu yayınladı . Kullanıcılar bir dokuya yaklaşıp ardından tekrar uzaklaşarak oyun içinde yeni oynanabilir sahneler oluşturabiliyordu.
Canlı sahneleri gerçek zamanlı olarak manipüle etmek, hesaplama açısından daha da zorlu. Decart, bu başarıyı elde etmek için Nvidia yongalarından yüksek hızlı hesaplamalar çıkarmak üzere düşük seviyeli kodlar yazdı. Mirage, 768 × 432 çözünürlükte saniyede 20 kare ve kare başına 100 milisaniye gecikme üretiyor; bu da iyi kalitede bir TikTok klibi için yeterince iyi.
Gerçek zamanlı video oluşturmak da zorlu bir iştir çünkü bir model gerçeklikten aşırı derecede uzaklaşabilir. Decart, daha fazla tutarlılık elde etmek için bir modeli eğitmek ve çalıştırmak için özel bir şema geliştirdi. Şirket ayrıca, modelinin hataları hızla düzeltmesini sağlayacak bir yöntem de geliştirdi.
Decart, full HD ve 4K çıkışa doğru ilerlediğini ve kullanıcıların videolarını kontrol etmeleri için yeni yollar bulduğunu söylüyor. Leitersdorf, "Yakında daha spesifik düzenlemeler yapmanıza olanak tanıyacak birçok yeni sürümümüz daha olacak," diyor.
Aracın TikTok veya Instagram gibi platformlarda popüler olacağını hayal edebiliyorum. Arkadaşlarımla tuhaf sahneler yaratmaya çalışırken, bazıları inanılmaz sayıda parmak kullanan, çok çeşitli gizemli görünümlü siberpunk karakterler yaratmaya çalışırken kesinlikle eğlendim. Ancak öngörülemezliği tartışmalı olabilir. Bazen model, açıklanamaz bir şekilde kullanıcının ırkını değiştirmeye niyetli gibi görünüyor.
Leitersdorf, kendi şirketinin dışında yalnızca en büyük yapay zeka laboratuvarlarının (OpenAI, Anthropic, xAI, Google ve Meta) Mirage gibi bir şey inşa edebilecek teknik kapasiteye sahip olduğunu söylüyor. Ancak satın alınmaya hiç niyeti yok. "Beş yılımız var ve bir kilo-tek boynuzlu at yaratmaya çalışacağız," diyor kalemini çevirirken. "Bu 1.000 milyar dolar veya bir trilyon kullanıcı demek."
wired