LTX-2: أول نموذج مفتوح المصدر يولد فيديو وصوت متزامنين
حققت نماذج تحويل النص إلى فيديو جودة بصرية ملحوظة، لكنها تنتج نتائج صامتة.[^1] يغير LTX-2 هذه المعادلة بالكامل. تم إصداره في 6 يناير 2026.[^2]
الملخص
يقدم LTX-2 بنية محول ثنائي التدفق غير متماثل: 14 مليار معامل للفيديو، 5 مليار للصوت.[^3]
النقاط الرئيسية
- أول نموذج سمعي بصري مفتوح: توليد متزامن للفيديو والصوت في نموذج واحد
- إخراج 4K أصلي: توليد عالي الدقة بدون تكبير
- صوت شامل: كلام وفولي وأجواء وعناصر عاطفية