AI 영상·이미지·생성 도구 분야의 오늘(2026/05/16) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.
1. LTX-2.3 립싱크 워크플로 실사 테스트—고정 카메라 단일 인물 결과
LTX-Video 2.3의 LipDub 워크플로를 실제 콘텐츠에 적용한 테스트 영상이 공개됐다. ‘오피스’의 Dwight 캐릭터 클립을 소재로 고정 카메라·단일 인물·직접 카메라 응시 조건에서 립싱크 정확도를 검증했으며, 이 조건이 현재 AI 립싱크의 가장 가혹한 스트레스 테스트로 평가됐다. 별도 마스크나 포스트 처리 없이 워크플로 단독으로 처리한 결과다. 현장 관점에선 인터뷰 컷이나 기업 홍보 영상처럼 ‘정면 고정 인물’ 편집에 즉시 써볼 수 있는 수준인지 직접 확인할 가치가 있다.

🔗 원문 보기 — LTX-2.3 LipDub test: Dwight reads the changelog
2. 마스크·후보정 없이 실사 영상 오브젝트 교체—Wan 2.2 Remix 계열 워크플로
후보정 마스크 없이 원본 RAW 영상에서 오브젝트를 실시간 교체하는 워크플로 데모가 공개됐다. Wan 2.2 Remix 기반으로, 기존 인페인팅 방식 대비 배경·조명 일관성이 개선됐다는 평가다. 검열 우회 목적으로 Wan 2.2 Remix를 찾는 커뮤니티 질문도 동시에 올라오는 걸 보면, 비검열 활용과 실무 활용이 혼재하는 상황이다. 현장 관점에선 광고 소품 교체나 뮤직비디오 오브젝트 스왑 용도로 마스크 작업 시간을 줄일 수 있는지가 핵심—워크플로 원본 재현성부터 확인해야 한다.
🔗 원문 보기 — Real object in raw video generation—no masks, no post-production; contents replaceable
3. FLUX Klein 9B + Anima Base 1.0 + Wan 2.2 조합 워크플로 공개
FLUX Klein 9B Pixel Space 모델과 Anima Base 1.0, Wan 2.2를 묶은 ComfyUI 워크플로가 Google Drive를 통해 무료 배포됐다. Klein 9B용 ComfyUI 커스텀 노드(ComfyUI-Klein9B-AsymFlow)도 별도 GitHub에 공개돼 즉시 설치 가능하다. Anima는 현재 HuggingFace diffusers 라이브러리 병합 PR(#13732)이 진행 중이라 OneTrainer 등 주요 트레이너 지원도 조만간 뒤따를 가능성이 높다. 현장 관점에선 세 모델 조합의 VRAM 요구량과 생성 속도 실측치가 아직 없어서, 워크플로 받기 전에 본인 GPU 스펙부터 체크하는 게 순서다.
🔗 원문 보기 — FLUX Klein 9B Pixel Space – ComfyUI Nodes
4. Microsoft, HuggingFace에 이미지 모델 ‘Lens·Lens-Turbo’ 올렸다 삭제
Microsoft가 HuggingFace에 ‘Lens’와 ‘Lens-Turbo’ 두 개의 이미지 모델을 업로드했다가 조용히 삭제한 정황이 포착됐다. HuggingPapers 계정을 통해 링크가 확산됐고, 현재 해당 페이지는 비공개 처리된 상태다. 공식 발표나 모델 카드 없이 올라왔다 내려간 것으로 보아 내부 테스트 유출이거나 출시 타이밍 조율 실패로 추정된다. 현장 관점에선 ‘Turbo’라는 명칭이 붙은 경량 버전이 포함됐다는 점에서 로컬 실행용 소형 이미지 모델 계열일 가능성이 있고, 정식 공개 시 주목할 필요가 있다.
🔗 원문 보기 — It appears that Microsoft uploaded an image model on HuggingFace and then deleted it.
5. DramaBox TTS, ComfyUI 노드로 음성 클로닝 직접 연결 가능
Resemble AI의 표정 있는 TTS 엔진 DramaBox가 ComfyUI 커스텀 노드(ComfyUI-DramaBox)로 통합됐다. 음성 클로닝 기능을 포함하며, 기존 Resemble AI API 계정이 있으면 ComfyUI 워크플로 안에서 바로 TTS를 호출할 수 있다. 별도 API 비용 구조는 Resemble AI 요금제를 따르므로 상업 프로젝트 투입 전 단가 계산이 필수다. 현장 관점에선 뮤직비디오나 광고 내레이션을 이미지·영상 생성 파이프라인과 한 워크플로로 묶고 싶은 팀에 실질적인 시간 단축이 가능한 업데이트다.
🔗 원문 보기 — DramaBox — Expressive TTS with Voice Cloning – comfyUI Update
6. ComfyUI AI 애니메이션 ‘덜컹거림’ 잡는 모션 에디터·리타기터 오픈소스 공개
Magos Digital Studio 팀이 AI 생성 캐릭터 애니메이션의 모션 불안정 문제를 교정하는 커스텀 ComfyUI 툴(모션 에디터 + 리타기터)을 오픈소스로 공개했다. 보정 전후 비교 영상을 함께 제공해 실제 개선 폭을 확인할 수 있다. Wan·Kling 계열 영상에서 빈번하게 발생하는 관절 떨림, 위치 드리프트 문제를 후처리 단계에서 잡는 방식이다. 현장 관점에선 AI 캐릭터 영상을 납품용으로 쓰려면 어차피 모션 클린업이 필수인데, 이 툴이 After Effects 수작업보다 빠른지 직접 비교해보는 것이 도입 판단의 기준이다.
7. Runway, 구글 꺾고 ‘월드 모델’ 선점 노리는 전략 공개 발언
Runway CEO가 WIRED 인터뷰에서 단순 영상 생성을 넘어 ‘월드 모델’ 구축을 목표로 한다고 공개적으로 밝혔다. ‘AI 인사이더가 아닌 것이 오히려 유리하다’는 발언과 함께, 구글·OpenAI와의 정면 경쟁을 선언한 셈이다. 현재 Gen-3 Alpha 이후 주력 모델 업데이트 소식이 뜸한 상황에서 나온 전략 발언이라 실제 제품 로드맵과의 간극이 주목된다. 현장 관점에선 거창한 비전 선언보다 Gen-4 혹은 차기 모델의 출시 일정과 가격이 더 급하고, 지금 당장 구독 갱신 여부를 고민하는 팀이라면 발표 내용만으로 판단 기준 삼기엔 부족하다.
🔗 원문 보기 — Runway started by helping filmmakers — now it wants to beat Google at AI
8. TeDiO: 추가 학습 없이 영상 시간 일관성 개선하는 확산 최적화 기법
arXiv에 공개된 TeDiO(Temporal Diagonal Optimization) 논문은 텍스트-영상 확산 트랜스포머에서 별도 재학습 없이 프레임 간 깜박임(flickering)과 시간적 불일치를 줄이는 추론 단계 최적화 방식을 제안한다. 어텐션 맵의 시간 대각선 구조를 활용해 일관성을 강제하는 원리로, Wan·CogVideoX 계열 모델에 적용 가능성이 있다. 학술 결과라 즉시 플러그인 형태로 쓸 수 없지만, ComfyUI 커스텀 노드 개발자들이 빠르게 구현에 나설 가능성이 있는 아이디어다. 현장 관점에선 재학습 비용 없이 기존 모델의 시간 일관성을 올릴 수 있다면 납품 퀄리티 기준을 충족하기 어려운 AI 영상의 실용성이 실제로 달라질 수 있다.
🔗 원문 보기 — TeDiO: Temporal Diagonal Optimization for Training-Free Coherent Video Diffusion
9. Suno 프롬프트 차단 패턴 정리—제목·아티스트 레퍼런스가 주요 원인
Suno에서 ‘부적절한 소재 포함’ 차단이 뜰 때 가사 내용이 아니라 제목, 아티스트 스타일 레퍼런스, 특정 단어 패턴이 원인인 경우가 많다는 실사용 분석이 공유됐다. 차단 전 확인해야 할 체크리스트가 함께 정리됐으며, 저작권 보호 아티스트명 직접 입력이 가장 흔한 차단 원인 중 하나로 지목됐다. 국내에서도 광고·콘텐츠 BGM 제작에 Suno를 쓰는 팀이 늘고 있는 만큼 실무 참고가 된다. 현장 관점에선 납품 직전에 차단 먹히면 시간 손해가 크니, 이 체크리스트를 팀 내 Suno 사용 가이드에 선제적으로 반영해두는 것이 낫다.
🔗 원문 보기 — Suno blocked my clean lyrics — here’s what I learned to check first
10. Armin van Buuren, AI 곡 ‘Voulez Vous’를 ASOT ‘이주의 곡’ 선정
트랜스 DJ Armin van Buuren이 Frank Spector의 AI 생성 곡 ‘Voulez Vous’를 자신의 레이블 Armind에 사인하고, 라디오쇼 ‘A State of Trance(ASOT)’에서 ‘이주의 곡’으로 선정한 뒤 게스트 믹스까지 초청했다. 메이저 EDM 씬에서 AI 트랙이 정식 레이블 계약·라디오 에어플레이까지 받은 공식 사례로는 이번이 가장 구체적인 케이스다. 국내 EDM 기반 광고 음악 시장에서도 유사한 흐름이 올 수 있다는 시그널이다. 현장 관점에선 ‘좋은 곡이면 출처 안 따진다’는 시장 반응이 확인된 사례인 만큼, AI 생성 BGM의 저작권 귀속 계약 조건을 미리 정리해두지 않은 팀은 지금 당장 검토가 필요하다.
🔗 원문 보기 — Armin van Buuren selects AI song for ‘Tune of the Week’ on ASOT
📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!
매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만