LTX-2: Het Eerste Open-Source Model dat Gesynchroniseerde Video en Audio Genereert
Text-to-video modellen hebben opmerkelijke visuele kwaliteit bereikt, maar produceren stille resultaten.[^1] LTX-2 verandert deze vergelijking volledig. Uitgebracht op 6 januari 2026.[^2]
Samenvatting
LTX-2 introduceert een asymmetrische dual-stream transformer architectuur: 14 miljard parameters voor video, 5 miljard voor audio.[^3]
Belangrijkste Inzichten
- Eerste Open Audiovisueel Model: Gesynchroniseerde video en audio generatie in één model
- Native 4K Output: Hoge resolutie generatie zonder upscaling
- Uitgebreide Audio: Spraak, foley, ambiance en emotionele elementen