LTX-2: सिंक्रनाइज़्ड वीडियो और ऑडियो जनरेट करने वाला पहला ओपन-सोर्स मॉडल
टेक्स्ट-टू-वीडियो मॉडल ने उल्लेखनीय दृश्य गुणवत्ता हासिल की है, फिर भी वे मौन परिणाम देते हैं।[^1] LTX-2 इस समीकरण को पूरी तरह बदल देता है।[^2]
मुख्य बिंदु
- पहला ओपन ऑडियोविजुअल मॉडल: एक मॉडल में सिंक्रनाइज़्ड वीडियो और ऑडियो जनरेशन
- नेटिव 4K आउटपुट: अपस्केलिंग के बिना उच्च-रिज़ॉल्यूशन जनरेशन