LTX-2: Mô hình Mã nguồn Mở Đầu tiên Tạo Video và Âm thanh Đồng bộ
Các mô hình chuyển văn bản sang video đã đạt được chất lượng hình ảnh đáng chú ý, nhưng tạo ra kết quả im lặng.[^1] LTX-2 thay đổi hoàn toàn phương trình này.[^2]
Điểm Chính
- Mô hình Nghe-Nhìn Mở Đầu tiên: Tạo video và âm thanh đồng bộ trong một mô hình
- Đầu ra 4K Gốc: Tạo độ phân giải cao mà không cần nâng cấp