Ki-Update Deep-Dive: yutturmaca ve engebeli gerçeklik arasında videojenikeratör

Aramizda · Bugün 21:12

Ki-Update Deep-Dive: yutturmaca ve engebeli gerçeklik arasında videojenikeratör

Hollywood filmleri yerine kısa klipler

AI videojenörleri genellikle medya yapımında bir sonraki büyük şey olarak kutlanır, bu da bir düğmeye basarak etkileyici film sahneleri oluşturabilen bir araçtır. Ancak, cilalı demo videolarının ötesine baktığınızda teknoloji gerçekten ne kadar iyi? C'T'den uzman André Kramer, mevcut beş model koydu – Sora von Openai, Adobe, Kling AI, Luma AI ve Pist ML'den Firefly. Sonuç: Gerçek hala hype'dan önemli ölçüde farklı. Sadece ortaya çıkan uzun, mükemmel videolar fikri mevcut duruma karşılık gelmez.

Metne girerek Hollywood'a hazır gişe rekorları kıranları umuyorsanız, hayal kırıklığına uğrayacaksınız. Kramer tarafından test edilen modeller şu anda sadece kısa klipler oluşturuyor. Kramer, “Yani piyasada olan ve test ettiğim video sterilleri beş saniye uzunluğunda video klipler yaratıyor.” Bazıları on saniye yaratır, ancak bu genellikle mevcut olanın bir uzantısıdır. Nedeni, görüntü jeneratörlerine benzer şekilde çalışan modellerin işlevselliğinde yatıyor, ancak tüm videoyu bir birim olarak değerlendiriyor. Başka bir önemli nokta: “Hiç ses yok. Yani onlar gerçekten sessiz filmler.”

Videolara hareketsiz görüntülerin animasyonu da kendi zorluklarınızı getiriyor. Bir resim sadece tutarlı görünmek zorunda olsa da, bir video süreklilik gerektirir – AI için büyük bir engel. Kramer örnekler verir: “Bir çocuk bir burger yerse, bir parça ısırılmalıdır.” Ya da bir binanın etrafında uçan bir helikopterle, bina deforme olmamalıdır. Geometri ve fizik ile ilgili sorunlar yaygındır. Görüntü jeneratörlerinin, ellerin temsili veya doğru sayıda parmak gibi “çocukluk hastalıkları” da videolarda bulunabilir. Kramer, parmakların ve ellerin “sadece her yerde” olduğu bir düğün sahnesinin raporları. Aksiyon sahneleriyle bile meraklı sonuçlar yaratılabilir: “Üç durumda, helikopter kanatları olan bir savaş uçağı vardı.”

Modellerin kalitesi ve özellikleri

Test, beş aday arasında kalitede belirgin farklılıklar olduğunu gösterdi. Kramer, “Kling Ai ve Openais Sora'nın en iyi sonuçları sunmaktan çok uzak.” Adobe Firefly, Luma ve testteki eski pist modeli “çok geride” düştü-Pist zaten testte henüz dikkate alınmayan pistten mevcuttu. Pist yaklaşımı ilginçtir, klipleri genellikle çok sessiz ve neredeyse yavaş hareket halinde görünür. Bu “akıllı benlik sınırlaması” daha az dinamiklere, aynı zamanda daha az hataya yol açar ve sonuçları, örneğin duman veya su estetik çekimleri için ticari olarak kullanılabilir hale getirir.

Sonucun kalitesi de büyük ölçüde istemine bağlıdır. Kramer'in tavsiyesi: “Çok karmaşık düşünme.” İstenen sahne ne kadar karmaşık olursa, AI'nın beklenmedik unsurları başarısız veya karıştırma olasılığı o kadar büyük olur. Resimlerdeki metin de zordur. Klişeler ve tekrar eden motifler en iyi şekilde çalışır, özellikle de Anglo -American geçmişine sahip olanlar. Çölde bir motel gibi sahneler, belirli bir Avrupa veya İskandinav estetiği olarak daha fazla başarılı olur. Bu, modellerin “yeniden ürettiğini” ve yaratıcılıklarında hala sınırlı olduğunu göstermektedir.

Yapay zeka ne kadar zeki? İşimiz, boş zamanlarımız ve toplumumuz için üretken yapay zekanın sonuçları nelerdir? Haberler'nin “AI Güncellemesi” nde, kod çözücü ile birlikte en önemli AI gelişmelerine güncellemeler getiriyoruz. Cuma günleri uzmanlarla AI devriminin farklı yönlerine ışık tutuyoruz.

Pratik kullanım ve etik sorular

Kramer'e göre, jeneratörler şu anda film yapımında profesyonel kullanım için sadece kısmen uygundur. Test gösterilerinden sonra karmaşık sahneler ve hatta “yeniden çekimler” için henüz yeterince kesin değildir. Olası nişler, örneğin, gerçek bir kayıt yoksa bir bina fotoğrafının animasyonu veya zaman basıncı durumunda geçici çözümlerdir. Kramer genellikle mevcut kaliteyi “istemeden komik” olarak görür.

Easy Operasyon, özellikle DeepFakes ile ilgili olarak etik soruları da gündeme getirir. Test edilen ticari hizmetler buna karşı koymaya çalışır. “Bu modeller […] Genellikle ABD'den veya Çin'den Kling yapay zekası gibi ve pornografik amaçlar için kullanımı sistem nedeniyle hariç tutulur “diye açıklıyor Kramer. Kramer. Ünlüler veya politikacılarla malzeme üretimi de bloke edilir. Başka bir hassas konu, eğitim materyali ve resim hakkıdır. telif hakkı ihlali hakkında şikayetlere yol açtı.

Genel olarak, test edilen AI video geriatriciler büyüleyici ama yine de olgunlaşmamış bir teknoloji gösteriyor. Gelişim hızla ilerliyor, yeni, güçlü modeller genellikle şaşırtıcı bir şekilde hızlı sırayla ortaya çıkıyor. Saf klip nesillere ek olarak Kramer, dudak senkronizasyonu ile otomatik video çevirisi veya video girişi yoluyla karakterlerin animasyonu gibi daha pragmatik uygulamalarda potansiyel görüyor. Gelecek neslin ne gibi bir ilerleme kaydedeceği görülüyor.

(IGR)

Ne yazık ki, bu bağlantı artık geçerli değil.

Boşa harcanan eşyalara bağlantılar 7 günden daha büyükse veya çok sık çağrıldıklarında geçersiz hale gelir.

Bu makaleyi okumak için bir Haberler+ paketine ihtiyacınız var. Bir haftayı şimdi yükümlülük altına almadan test edin – yükümlülük olmadan!

Ki-Update Deep-Dive: yutturmaca ve engebeli gerçeklik arasında videojenikeratör

Aramizda

Aktif Üye