Meta tarafından metin istemlerine dayalı olarak sesle gerçekçi görüntüler üretebilen Movie Gen medya temelli yapay zeka modelleri ailesi duyuruldu. Meta Movie Gen ailesi Movie Gen Görüntü ve Movie Gen Audio olmak üzere iki ana modelden oluşuyor:
Movie Gen Görüntü tek bir metin isteminden yüksek kaliteli, yüksek çözünürlüklü imajlar ve görüntüler üretebilen 30 milyar parametreli bir dönüştürücü model. Oluşturulan görüntüler saniyede 16 kare suratında 16 saniyeye kadar uzunluğa sahip olabiliyor.
Movie Gen Audio ise isteğe bağlı metin istemleriyle birlikte bir görüntü girişi alabilen ve giriş görüntüsüyle senkronize olan 45 saniyeye kadar yüksek kaliteli ses üretebilen 13 milyar parametreli bir diğer dönüştürücü model Bu yeni ses modeli ortam sesi, enstrümantal art plan müziği ve Foley sesi üretebiliyor. Meta, modelin ses kalitesi, video-ses hizalaması ve metin-ses hizalaması açısından en son teknoloji sonuçları sunduğunu sav ediyor.
Bu modeller sadece orijinal görüntüler oluşturmak için değil. Kolay metin istemleri kullanarak mevcut görüntüleri düzenlemek için de kullanılabiliyor. Movie Gen, kullanıcıların art plan yahut tarz değişiklikleri üzere genel değişikliklere ek olarak, öğeler ekleme, kaldırma yahut değiştirme üzere yerelleştirilmiş düzenlemeler yapmalarına da imkan tanıyor.
Movie Gen modelleri, kullanıcıların şahsileştirilmiş görüntüler oluşturmasına imkan tanıyor. Bir kişinin imgesini ve bir metin istemini kullanarak, bu modeller insan kimliğini ve hareketini koruyan şahsileştirilmiş görüntüler oluşturabiliyor. Meta, bu modellerin görüntüde karakter muhafaza ve doğal hareket konusunda en son teknoloji sonuçları sağladığını sav ediyor.
Meta, bu modellerin OpenAI Sora ve Runway Gen-3 dahil olmak üzere öteki görüntü oluşturma modellerinden daha âlâ görüntüler oluşturduğunu argümanında. Şirket şu anda modeli kamuoyuna sunmadan evvel daha da uygunlaştırmak için yaratıcı profesyonellerle çalışıyor.
macOS Sequoia 15.0.1 Güncellemesi Yanılgı Düzeltmeleri ile Geldi
1
NVIDIA Studio’da Yaratıcılığı ve İnovasyonu Destekleyen Yeni Uygulamalar
9559 kez okundu
2
LG DukeBox ve CineBeam Qube CES 2024’te Uzunluk Gösterecek
4181 kez okundu
3
300 Milyon Bireye İlişkin Bilgileri Ruslara Satan Ukraynalı Hacker Tutuklandı
3885 kez okundu
4
ABD Kongresinden Filistin-İsrail meselesinde ‘iki devletli çözüme’ destek
2339 kez okundu
5
ABD Kongresinden Filistin-İsrail meselesinde ‘iki devletli çözüme’ destek tasarısı
1341 kez okundu