LTX 2.3 distilled가 공개된 지 얼마 안 됐다. 그런데 이미 커뮤니티에서는 Wan 계열보다 빠르고 품질은 비등하다는 이야기가 돌고 있다. 로컬 GPU로 AI 영상 생성을 버텨온 1인 제작자·소규모 스튜디오 입장에서 지금 당장 확인해야 할 것은 하나다. RTX 4060Ti 16GB가 이 모델을 실제로 감당할 수 있는가.
해상도와 프레임 수: 어디가 천장인가
VRAM 16GB 환경에서 LTX 2.3 distilled를 돌릴 때 가장 먼저 벽에 부딪히는 지점은 해상도다. 프레임 수나 LoRA 적재보다 해상도가 VRAM을 먼저 잡아먹는다. 아직 이 조합으로 실제 납품이나 시안 작업이 쌓인 사례는 많지 않다. 모델 자체가 막 나왔기 때문이다. 현실적으로 안정적인 세팅값을 찾으려면 커뮤니티 벤치마크와 직접 테스트를 병행하는 수밖에 없다. 768×432에서 49프레임 정도가 초기 커뮤니티에서 자주 언급되는 조합이지만, 이 수치가 모든 노드 구성에서 동일하게 작동한다는 보장은 없다.

VAE 디코딩을 타일링으로 쪼개면 VRAM 한계를 일부 우회할 수 있다. 이음새 아티팩트는 가끔 튀는 정도로, 후보정으로 해결 가능한 수준이다. 납품 불가 빈도가 높지 않다는 뜻이기도 하지만, ‘가끔’이 어떤 클립에서 터질지 예측이 안 된다는 점은 감안해야 한다.
실행 경로: ComfyUI, LTX Desktop App, PyTorch 코드베이스
LTX 2.3을 로컬에서 실행하는 공식 경로는 세 가지다. ComfyUI(HuggingFace 공식 페이지에서 ComfyUI Manager를 추천), LTX Desktop App(공식 무료 로컬 편집기), 그리고 GitHub 공식 PyTorch 코드베이스(github.com/Lightricks/LTX-2)가 모두 공식 경로로 명시되어 있다. ltx.io 공식 페이지는 ComfyUI와 Fal을 ‘완전 지원’으로 표기하면서도 단독 경로라고 설명하지 않는다. 실제로 커뮤니티에서 가장 널리 쓰이는 것은 ComfyUI다. diffusers 파이프라인 대비 ComfyUI가 체감상 상당히 빠르다는 평가가 많다. 같은 클립 기준으로 두 경로의 속도 차이는 무시할 수준이 아니다. 세팅 진입 장벽을 고려하더라도 ComfyUI를 먼저 잡는 게 현실적이다.

클라우드 vs 로컬: 손익분기점
RunPod나 Replicate 같은 클라우드 API 대비 로컬 세팅의 비용 우위는 월 100클립 이상 생산할 때부터 안정적으로 확보된다. 케이스마다 단가 차이가 있어 단순 비교는 어렵지만, 월 100개라는 숫자는 SNS 숏폼 납품을 주력으로 하는 1인 스튜디오에게 충분히 현실적인 기준이다. 클라우드는 초기 진입 비용이 없는 대신 생산량이 늘수록 단가가 쌓인다. 로컬은 반대다.
현재 RTX 4060Ti 16GB 단품 가격은 국내 기준 100만 원 안팎으로 형성되어 있어 진입 허들 자체는 낮다. 문제는 이 사양이 앞으로 얼마나 버텨줄 수 있느냐다.
1년 뒤 기준선은 4060Ti가 아닐 수 있다
“에이, 1년 뒤면 기준선이 더 높아지지 않을까. 오픈소스와 노드 개발이 풀릴수록 로컬의 비용·커스터마이징 장점은 분명히 커진다. 그런데 그렇다고 4060Ti를 기준으로 잡지는 않을 것 같다. RTX 5080 기준으로 보면 현재 국내 단품 최저가가 180만 원대 초반 수준(2025년 5월 기준)이고, 이를 포함한 완성 PC 견적은 사양 구성에 따라 다르지만 고사양 워크스테이션 기준으로 보면 업계에서 그렇게 비싼 가격은 아니다. 결국 좋은 사양으로 빠르게, 많이, 좋은 퀄리티로 뽑히는 게 더 중요하다.”
지금 4060Ti 16GB로 LTX 2.3을 쓰는 건 가능하다. 단, 해상도 천장이 낮고, 납품 가능한 품질 조합은 아직 커뮤니티에서 수렴 중이다. 월 100클립 이하라면 클라우드가 오히려 편하다. 장비 업그레이드를 고민하고 있다면, 지금 4060Ti를 사는 돈으로 얼마나 더 보탤 수 있는지를 먼저 계산해 보는 편이 낫다.