Tencent, HunyuanVideo ismini verdiği açık kaynaklı olan son teknoloji yapay zeka görüntü oluşturma modelini duyurdu. HunyuanVideo, çıkarım kodu ve model tartılarının herkes için açıkça erişilebilir olduğu birinci büyük açık kaynaklı görüntü oluşturma modeli olarak karşımıza çıkıyor.
Tencent, HunyuanVideo’nun yüksek görsel kalite, hareket çeşitliliği, metin-video hizalaması ve oluşturma kararlılığı ile önde gelen kapalı kaynaklı modellerle karşılaştırılabilir görüntüler üretebileceğini tez ediyor. Model, 13 milyardan fazla parametreyle tüm açık kaynaklı görüntü oluşturma modelleri ortasında en büyüğü. Model ayrıyeten; bilgi düzenleme, görüntü-video ortak model eğitimi ve büyük ölçekli model eğitimi ve çıkarımı desteklemek için verimli bir altyapıyı entegre eden bir çerçeve içeriyor.
Tencent ayrıyeten modeli profesyonel insan değerlendirmesi kullanarak test etti. Kıymetlendirme sonuçlarına nazaran HunyuanVideo, Runway Gen-3 ve Luma 1.6 dahil olmak üzere tüm önde gelen kapalı kaynaklı son teknoloji modellerden daha güzel performans gösteriyor.
HunyuanVideo, Transformer dizaynını sunuyor ve birleşik manzara ve görüntü üretimi için Tam Dikkat düzeneğini kullanıyor. Bilhassa, görüntü üretimi için “Çift akıştan Tek akışa” hibrit model tasarımı kullanılıyor. Çift akış evresinde, görüntü ve metin belirteçleri birden fazla Transformer bloğu aracılığıyla bağımsız olarak işleniyor ve her bir modalitenin kendi uygun modülasyon düzeneklerini müdahale olmadan öğrenmesini sağlanıyor. Tek akış kademesinde, görüntü ve metin belirteçlerini birleştiriliyor ve tesirli çok modlu bilgi füzyonu için bunları sonraki Transformer bloklarına besleniyor. Bu tasarım, görsel ve anlamsal bilgiler ortasındaki karmaşık etkileşimleri yakalayarak genel model performansını artırıyor.
Açık kaynak kodu ve yükleriyle HunyuanVideo yapay zeka görüntü üretim ekosisteminde bir ihtilal yaratabilir.
Threads, Profil ve Tarih Aralığına Nazaran Aramalarınızı Daraltmanızı Kolaylaştıracak
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.