Tencent, HunyuanVideo ismini verdiği açık kaynaklı olan son teknoloji yapay zeka görüntü oluşturma modelini duyurdu. HunyuanVideo, çıkarım kodu ve model tartılarının herkes için açıkça erişilebilir olduğu birinci büyük açık kaynaklı görüntü oluşturma modeli olarak karşımıza çıkıyor.
Tencent, HunyuanVideo’nun yüksek görsel kalite, hareket çeşitliliği, metin-video hizalaması ve oluşturma kararlılığı ile önde gelen kapalı kaynaklı modellerle karşılaştırılabilir görüntüler üretebileceğini tez ediyor. Model, 13 milyardan fazla parametreyle tüm açık kaynaklı görüntü oluşturma modelleri ortasında en büyüğü. Model ayrıyeten; bilgi düzenleme, görüntü-video ortak model eğitimi ve büyük ölçekli model eğitimi ve çıkarımı desteklemek için verimli bir altyapıyı entegre eden bir çerçeve içeriyor.
Tencent ayrıyeten modeli profesyonel insan değerlendirmesi kullanarak test etti. Kıymetlendirme sonuçlarına nazaran HunyuanVideo, Runway Gen-3 ve Luma 1.6 dahil olmak üzere tüm önde gelen kapalı kaynaklı son teknoloji modellerden daha güzel performans gösteriyor.
HunyuanVideo, Transformer dizaynını sunuyor ve birleşik manzara ve görüntü üretimi için Tam Dikkat düzeneğini kullanıyor. Bilhassa, görüntü üretimi için “Çift akıştan Tek akışa” hibrit model tasarımı kullanılıyor. Çift akış evresinde, görüntü ve metin belirteçleri birden fazla Transformer bloğu aracılığıyla bağımsız olarak işleniyor ve her bir modalitenin kendi uygun modülasyon düzeneklerini müdahale olmadan öğrenmesini sağlanıyor. Tek akış kademesinde, görüntü ve metin belirteçlerini birleştiriliyor ve tesirli çok modlu bilgi füzyonu için bunları sonraki Transformer bloklarına besleniyor. Bu tasarım, görsel ve anlamsal bilgiler ortasındaki karmaşık etkileşimleri yakalayarak genel model performansını artırıyor.
Açık kaynak kodu ve yükleriyle HunyuanVideo yapay zeka görüntü üretim ekosisteminde bir ihtilal yaratabilir.
Threads, Profil ve Tarih Aralığına Nazaran Aramalarınızı Daraltmanızı Kolaylaştıracak
1
NVIDIA Studio’da Yaratıcılığı ve İnovasyonu Destekleyen Yeni Uygulamalar
9559 kez okundu
2
LG DukeBox ve CineBeam Qube CES 2024’te Uzunluk Gösterecek
4181 kez okundu
3
300 Milyon Bireye İlişkin Bilgileri Ruslara Satan Ukraynalı Hacker Tutuklandı
3885 kez okundu
4
ABD Kongresinden Filistin-İsrail meselesinde ‘iki devletli çözüme’ destek
2339 kez okundu
5
ABD Kongresinden Filistin-İsrail meselesinde ‘iki devletli çözüme’ destek tasarısı
1341 kez okundu
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.