AI 영상·이미지·생성 도구 분야의 오늘(2026/05/09) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.
1. Flux.2-Klein, RTX 5090 한 장으로 웹캠 30FPS 실시간 변환
Flux.2-Klein-4B 모델 기반 파이프라인이 공개됐다. RTX 5090 단일 GPU에서 약 0.2초 레이턴시로 웹캠 영상을 30FPS로 실시간 스타일 변환할 수 있으며, 완전 무료·오픈소스다. 기존 Flux 계열 모델들이 단일 이미지 생성에 머물렀던 것과 달리, 이번엔 라이브 스트림 처리까지 확장된 게 핵심이다. 다만 RTX 5090이 전제 조건이라 현실적으로 접근 가능한 현장은 아직 제한적이고, RTX 4090 이하 세팅에서의 성능은 아직 검증 데이터가 없다. 현장 관점에선 라이브 이벤트나 뮤직비디오 실시간 모니터 합성 용도로 가능성은 있지만, 하드웨어 장벽이 먼저다.

🔗 원문 보기 — Flux.2-Klein pipeline for real-time webcam stream processing in 30 FPS
2. LTX 2.3, 크레딧 전용 공개…오픈소스 약속 슬그머니 후퇴
LTX Video 2.3이 공식 발표 없이 LTX Studio 크레딧 과금 방식으로만 먼저 풀렸다. 기능상으로는 Kling Motion 3.0의 비디오-투-비디오와 유사한 수준으로 평가되며, 인페인팅 성능도 개선됐다는 현장 리포트가 있다. 그런데 문제는 오픈소스 기반이었던 기존 LTX와 달리 이번엔 공개 가중치나 ComfyUI 지원 일정이 명시되지 않은 채 유료 플랫폼으로 먼저 진입했다는 점이다. Q5 PolarQuant 양자화 버전(코사인 유사도 0.9986, 용량 88% 절감)이 비공식으로 돌고 있지만, 공식 ComfyUI 노드 지원 시점은 불명확하다. 현장 관점에선 ‘LTX는 무료’라는 공식이 흔들리고 있으니, 워크플로 의존도를 높이기 전에 라이선스 정책 변화를 주시해야 한다.
🔗 원문 보기 — LTX 2.3 Sneaky Drop! (Has gatekeeping started)…
3. LTX 2.3 인페인팅, TV 광고·OTT 실전 투입 2주 R&D 결과
AI 프로덕션 스튜디오 DOGMA가 LTX 2.3 인페인팅으로 2주간 R&D한 결과를 공개했다. 해당 스튜디오는 이미 넷플릭스 이탈리아 쇼 작업에 AI를 투입했고, 헐리우드 미팅도 진행 중이라고 밝혔다. 실제 TV 광고·OTT 납품 레벨에서의 인페인팅 활용 사례라는 점에서 ‘가능성 데모’가 아니라 현업 검증 리포트에 가깝다. 구체 수치나 원본 비교 영상이 함께 공유됐으며, 배경 교체·객체 제거 시나리오에서 실용적인 결과물이 나왔다는 평이다. 현장 관점에선 인페인팅이 VFX 후반 작업의 로토·클린업 단계를 대체할 첫 번째 실전 후보가 되고 있다는 신호로 읽힌다.
🔗 원문 보기 — Inpainting with LTXV 2.3. Results after two weeks of R&D.
4. WAN 2.2 + 캐릭터 LoRA, AI 인플루언서 영상 일관성 유지 워크플로 공개
WAN 2.2에 커스텀 아이덴티티 LoRA를 결합해 동일 캐릭터의 얼굴을 영상 전반에 고정하는 워크플로가 커뮤니티에 공유됐다. 핵심은 LoRA 학습 데이터 구성 방식과 추론 시 강도 조절 파라미터인데, 작성자는 ‘다른 곳에서 깔끔한 가이드를 못 찾아서 직접 정리했다’고 밝혔다. 한국에서도 AI 인플루언서·버추얼 모델 콘텐츠 수요가 빠르게 늘고 있는 만큼, 얼굴 일관성 문제는 가장 자주 맞닥뜨리는 병목이다. 동의 기반 LoRA 학습(consented LoRA)임을 명시한 점도 눈에 띄는데, 초상권·동의 이슈가 한국 광고 시장에서도 슬슬 수면 위로 올라오는 시점이다. 현장 관점에선 이 워크플로가 버추얼 모델 캐스팅 비용을 줄이는 실질적인 대안이 될 수 있다.
5. Kling 3.0 4K, 사이버펑크 서울 실사 테스트 결과
Kling 3.0 모델의 4K 출력 기능을 사이버펑크 서울 콘셉트 영상으로 실전 테스트한 결과물이 공개됐다. 작성자는 ‘시각적 선명도가 솔직히 놀라운 수준’이라고 평가했으며, 한국 로케이션 분위기를 AI로 구현한 사례라는 점에서 국내 광고·뮤직비디오 제작자에게 직접적인 참고가 된다. Kling 3.0은 현재 유료 플랜 기준 월 구독 방식으로 제공 중이고, 4K 출력은 상위 티어에서만 가능하다. 서울·도시 배경 시각 언어에 대한 모델 이해도가 어느 수준인지 확인할 수 있는 드문 한국어 맥락 테스트다. 현장 관점에선 로케이션 헌팅 비용이 부담스러운 소규모 뮤직비디오 프로덕션에서 Kling 4K가 프리비즈 이상의 역할을 할 수 있다는 가능성을 보여준다.
🔗 원문 보기 — Cyberpunk Seoul kling3.0 4k
6. LTX 2.3 ComfyUI 자동화 뮤직비디오 워크플로, 무료·로컬 공개
LTX 2.3을 ComfyUI에서 돌려 자동화된 뮤직비디오를 로컬로 생성하는 풀 워크플로가 무료 공개됐다. Suno AI로 음악을 만들고, Grok Imagine으로 캐릭터를 뽑은 뒤, LTX 2.3으로 영상화하는 파이프라인 전체를 다룬다. 클라우드 크레딧 없이 로컬 GPU만으로 뮤직비디오 한 편을 뽑아내는 엔드투엔드 가이드가 드물었던 만큼, 인디 뮤지션·저예산 콘텐츠 제작자에겐 실질적인 레퍼런스다. 다만 LTX 2.3의 공식 ComfyUI 노드 지원이 아직 불안정한 상황이라, 버전 호환성 문제는 직접 확인이 필요하다. 현장 관점에선 뮤직비디오 한 편을 GPU 한 대로 완성하는 파이프라인이 현실화되고 있다는 점 자체가 이미 단가 구조를 흔들고 있다.
🔗 원문 보기 — Create automated AI music videos with my full LTX 2.3 workflow for ComfyUI. FREE and LOCAL
7. Anima, Scribble+Canny+Depth 멀티 컨트롤 강도 조절 기능 추가
ComfyUI 기반 이미지 생성 모델 Anima에 Scribble, Canny, Depth 컨트롤넷을 동시에 쓸 수 있는 멀티 컨트롤 기능이 업데이트됐다. 핵심은 각 컨트롤의 강도(strength)를 개별 조절할 수 있게 됐다는 점이다. 기존 단일 컨트롤넷으로는 구도와 엣지, 입체감을 동시에 잡기가 어려웠는데, 이 조합으로 광고 스틸 컷이나 콘셉트 아트 레퍼런스 컨트롤 정밀도가 올라간다. HuggingFace의 CabalResearch 리포지토리에서 무료로 내려받을 수 있다. 현장 관점에선 광고 비주얼 방향을 잡는 프리프로덕션 단계에서, 클라이언트 컨펌용 시안을 빠르게 뽑는 데 즉시 써볼 만하다.
🔗 원문 보기 — Anima Scribble+Canny (and Depth in the corner), now with adjustable strength
8. 존 레논 AI 다큐 논란, AI 영상의 초상·윤리 기준 어디까지인가
고인이 된 존 레논을 AI 영상으로 복원하는 다큐멘터리 프로젝트가 공개되며 업계 논쟁에 불을 붙였다. 비틀즈 측이 실제로 이를 승인했는지, 유족 동의만으로 고인의 AI 재현이 정당화되는지에 대한 법적·윤리적 물음이 제기됐다. 한국도 광고·뮤직비디오에서 고인 혹은 실존 인물의 AI 재현 요청이 늘고 있는데, 현행 저작권법과 퍼블리시티권 사이의 회색지대가 여전히 정리되지 않은 상태다. 이 사례는 ‘기술적으로 가능하다’와 ‘법적으로 안전하다’가 전혀 다른 문제임을 다시 확인시켜준다. 현장 관점에선 클라이언트가 실존 인물 AI 재현을 요청할 때 반드시 법률 검토를 선행 조건으로 계약서에 명시해두는 게 제작사 리스크 관리의 기본이 됐다.
🔗 원문 보기 — New John Lennon documentary will be a controversial test for AI video
9. ShowMe, ComfyUI 워크플로에 시각 주석 레이어 추가하는 확장 출시
ComfyUI 확장 ‘ShowMe’가 출시됐다. 캔버스 위에 시각적 주석(화살표, 메모, 하이라이트 등)을 얹어 워크플로 설명 자료를 만들 수 있고, 실제 노드 동작에는 영향을 주지 않는다. 선택 옵션으로 ‘Ask AI’ 모드도 있어, 현재 워크플로 상태를 AI가 읽고 설명해준다. 팀 단위로 ComfyUI 워크플로를 공유하거나, 클라이언트·협업자에게 파이프라인을 설명해야 하는 상황에서 유용하다. 한국 프로덕션 현장에서 ComfyUI 워크플로를 외주 스태프에게 인계하거나 아카이빙할 때 스크린샷 위에 설명을 얹는 작업이 꽤 번거로웠는데, 이걸로 그 부분이 깔끔하게 해결된다. 현장 관점에선 실력보다 ‘설명 가능한 워크플로’를 요구하는 클라이언트가 늘고 있는 지금, 이런 도구가 의외로 실용적이다.
10. LTX-2.3 22B Q5 양자화, 원본 대비 88% 용량 절감·품질 손실 거의 없음
LTX-2.3 22B 모델의 PolarQuant Q5 양자화 버전이 비공식으로 공개됐다. 원본 대비 파일 크기가 88% 줄었고, 코사인 유사도는 0.9986으로 품질 손실이 사실상 없는 수준이다. 22B 파라미터 풀 모델은 일반 로컬 환경에서 돌리기 버거웠는데, 이 정도 압축이면 24GB VRAM 이하 GPU에서도 실행 가능성이 열린다. 다만 공식 ComfyUI 지원은 아직 없고, 압축 해제 과정이 필요하다는 보고가 있어 즉시 플러그인 방식으로 쓰긴 어렵다. 현장 관점에선 풀 품질의 LTX 2.3을 저사양 로컬에서 돌리고 싶다면 지금 당장 테스트 가치가 있지만, ComfyUI 공식 노드 지원 전까지는 세팅 시간을 감수해야 한다.
📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!
매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만