LTX-2: 동기화된 비디오와 오디오를 생성하는 최초의 오픈소스 모델
텍스트-투-비디오 모델은 놀라운 시각적 품질을 달성했지만 무음 결과를 생성합니다.[^1] LTX-2는 이 방정식을 완전히 바꿉니다. 2026년 1월 6일 출시되었습니다.[^2]
요약
LTX-2는 비대칭 듀얼 스트림 트랜스포머 아키텍처를 도입합니다: 비디오용 140억 파라미터, 오디오용 50억 파라미터.[^3]
핵심 요점
- 최초의 오픈 시청각 모델: 단일 모델에서 동기화된 비디오와 오디오 생성
- 네이티브 4K 출력: 업스케일링 없이 고해상도 생성
- 포괄적인 오디오: 스피치, 폴리, 앰비언스, 감정적 요소