AI 영상·이미지·생성 도구 분야의 오늘(2026/05/29) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.
1. Wan 2.2 14B NVFP4 양자화 체크포인트 출시, 속도 대폭 향상 주장
Lightx2v가 WAN 2.2 14B 모델의 NVFP4 스파스(sparse) 체크포인트를 허깅페이스에 공개했다. 기존 FP16 대비 ‘상당한 속도 향상’을 주장하나, 공개된 벤치마크에서 ‘Wan2.2-T2V-14B’ 컬럼이 Lightning 포함인지 미포함인지 명시하지 않아 실제 수치 해석에 주의가 필요하다. NVFP4는 NVIDIA 4세대 아키텍처(Hopper 이상) 최적화 포맷으로, RTX 3000·4000 시리즈에서는 동일한 이득을 기대하기 어렵다. 14B급 WAN 영상 모델을 로컬에서 돌리는 데 병목이던 속도 문제가 어느 정도 해소된다면 광고·MV 프리프로덕션 테스트 단계에서 반복 생성 비용이 줄어들 수 있다. 현장 관점에선 RTX 5090 이상 보유자가 아니면 체감 차이를 먼저 확인하고 전환 여부를 판단하는 게 맞다.

🔗 원문 보기 — Lightx2v just released NVFP4 ckpt for WAN 2.2 14b
2. InvokeAI 6.13.0 릴리즈 — 로컬 이미지 생성 플랫폼 신버전
InvokeAI 팀이 6.13.0 버전을 정식 출시했다. InvokeAI는 로컬 구동 기반의 크리에이터 중심 이미지 생성 플랫폼으로, ComfyUI 대비 UI/UX 접근성이 높아 노드 작업에 익숙하지 않은 팀원도 온보딩이 빠르다. 이번 업데이트의 구체적 변경 사항은 공식 릴리즈 노트에서 확인해야 하지만, 최근 버전 흐름상 Flux·SDXL 워크플로 안정성 및 LoRA 관리 기능 개선이 지속되고 있다. 광고 제작사 내부에서 레퍼런스 이미지 시안 생성용으로 쓰는 팀이 늘고 있는 만큼, 버전 고정 없이 업데이트해 쓰던 팀이라면 6.13.0으로 마이그레이션 전 플러그인 호환성 체크는 필수다. 현장 관점에선 ComfyUI와 병행 운용하는 스튜디오라면 6.13.0 체인지로그 한 번 훑고 실제 도입 여부를 결정하면 충분하다.
🔗 원문 보기 — InvokeAI 6.13.0 Released
3. ComfyUI 네이티브 프레임 보간 노드 추가 — FILM·RIFE v4.26 지원
4월부터 ComfyUI 공식 빌드에 ‘Frame Interpolate’ 노드가 네이티브로 포함됐다. FILM과 RIFE(v4.26 포함)를 지원하며, 모델은 Comfy-Org 허깅페이스에서 직접 받을 수 있다. 기존에는 별도 커스텀 노드(예: ComfyUI-RIFE)를 설치해야 했고, 버전 충돌 문제가 잦았다. 네이티브 통합으로 WAN·LTX 생성 영상을 후처리 인터폴레이션하는 파이프라인 구성이 단순해졌고, 유지보수 부담도 준다. 뮤직비디오나 광고 쇼트 클립에서 24fps를 60fps로 올리는 작업을 ComfyUI 단일 워크플로 안에서 처리할 수 있게 됐다는 게 실질적인 변화다. 현장 관점에선 이미 커스텀 노드로 돌리고 있다면 네이티브 버전과 출력 품질 비교를 먼저 해볼 것을 권한다.
🔗 원문 보기 — FYI there’s now native frame interpolation in ComfyUI
4. Film Auteur (LTXV) 노드 v2.0.5 업데이트 — LTX 2.3 전용 ComfyUI 노드
triXope의 Film Auteur LTXV 노드가 2.0.5 버전으로 업데이트됐다. LTX Video 2.3 전용으로 개발된 이 노드는 영화적 룩·카메라 무브먼트·시퀀스 일관성 제어를 목표로 설계됐으며, 초기 출시 이후 꾸준히 기능을 추가해왔다. 구체적 신규 기능은 개발자 포스트에서 확인해야 하지만, LTX 계열 영상 생성에서 스타일 일관성과 컷 간 연속성을 잡는 데 특화된 노드라는 점에서 MV·쇼트폼 광고 제작에 적용 가능성이 있다. LTX 2.3 기반 워크플로를 이미 쓰고 있다면 추가 설치 비용 없이 테스트할 수 있다. 현장 관점에선 ‘Film Auteur’라는 이름만큼 실제 영화적 제어가 되는지는 직접 프로젝트에 넣어봐야 알 수 있고, 마케팅 문구 그대로 믿지 않는 게 좋다.
🔗 원문 보기 — Film Auteur (LTXV) version 2.0.5 update
5. Caption Creator v11.0 — Ollama·LM Studio 연동 로컬 이미지 캡셔닝 툴
Caption Creator가 v11.0으로 업데이트되며 Ollama와 LM Studio 연동을 지원하기 시작했다. 로컬에서 이미지에 대한 캡션·태그·JSON·YAML·Illustrious 형식 출력을 생성하는 Windows 포터블 앱으로, 외부 API 없이 오프라인 환경에서 LoRA 학습용 데이터셋 캡셔닝을 처리할 수 있다. 특히 인물 LoRA나 제품 이미지 대량 캡셔닝 작업에서 WD14나 BLIP 단독 사용보다 디테일한 텍스트 기술이 가능하다. 광고 소재 LoRA 학습 파이프라인을 인하우스로 운영하는 팀에게 API 비용 없이 캡셔닝 품질을 높이는 현실적인 옵션이다. 현장 관점에선 Ollama 모델 선택에 따라 캡셔닝 품질 편차가 크므로 LLaVA 계열과 최신 멀티모달 모델을 비교 테스트하고 데이터셋에 맞는 모델을 고정해두는 게 효율적이다.
6. Kling 3으로 만든 게임 트레일러 — 실제 활용 사례
Reddit 사용자가 Kling 3을 활용해 인디 게임 ‘REPTL’의 영상 트레일러를 제작해 공개했다. 아직 Kling 3은 국내 접근성이 제한적이고 월정액 기준 Pro 플랜이 $36 선이지만, 인디 게임·앱 트레일러처럼 예산이 빠듯한 프로젝트에서 실제 촬영 대신 AI 영상 생성으로 대체하는 사례가 늘고 있다는 게 포인트다. 해당 결과물의 실제 품질은 원문 링크에서 확인해야 하지만, Kling 2.1·3 세대에서 캐릭터 일관성과 카메라 무브먼트 안정성이 눈에 띄게 개선됐다는 평가가 지속된다. 한국에서도 게임사·앱 스타트업 홍보 영상 수주 시 Kling 계열 툴 활용 레퍼런스로 제시할 수 있다. 현장 관점에선 트레일러 특성상 사운드 디자인과 편집이 AI 영상 품질보다 최종 인상을 더 좌우하므로, 영상 생성 툴 선택만큼 후반 작업 리소스 배분을 신경 써야 한다.
🔗 원문 보기 — Video trailer for REPTL – Made with Kling 3
7. Anthropic, 시리즈 H 650억 달러 조달 — 기업가치 9,650억 달러
Anthropic이 시리즈 H 라운드에서 650억 달러를 조달하며 포스트머니 기업가치 9,650억 달러를 기록했다. IPO 전 마지막 프라이빗 펀딩 라운드로 평가되며, Claude 계열 모델의 기업 시장 침투 가속화가 예상된다. 영상 제작 현장과의 직접 연관성은 낮아 보이지만, Anthropic의 자금력 확대는 Claude API 기반 프로덕션 자동화 툴(스크립트 생성·캡셔닝·메타데이터 처리 등)의 가격 경쟁력과 안정성에 영향을 준다. 특히 제작사 내부 워크플로 자동화를 Claude API로 구축 중인 팀이라면 서비스 연속성 측면에서 긍정적 신호다. 현장 관점에선 기업가치 숫자보다 실제 API 요금 변동과 엔터프라이즈 플랜 조건 변화를 주시하는 게 더 실용적이다.
🔗 원문 보기 — Anthropic raises $65 billion, nears $1T valuation ahead of IPO
8. 일리노이주 미국 최강 AI 안전법 통과 — OpenAI·Anthropic도 동의
일리노이주 의회가 미국에서 가장 강력한 수준의 AI 안전 법안을 통과시켰다. OpenAI·Anthropic·Google 등 주요 AI 기업에 제3자 안전 검증 의무를 부과하는 내용으로, 주지사 서명이 예정돼 있다. 단기적으로 한국 영상 제작 현장에 직접 영향은 없지만, 미국 규제 강화가 글로벌 AI 툴 서비스 조건 및 콘텐츠 정책에 연쇄 영향을 줄 수 있다는 점에서 주목할 필요가 있다. 특히 딥페이크·얼굴 교체 기능을 포함한 툴들이 향후 규제 타깃이 될 가능성이 높아, 광고·MV에서 해당 기능을 활용 중인 팀은 사용 약관 변화를 모니터링해야 한다. 현장 관점에선 한국도 AI 기본법 시행(2026년) 앞두고 있어, 글로벌 규제 흐름을 레퍼런스로 내부 가이드라인을 정비할 타이밍이다.
🔗 원문 보기 — Illinois Lawmakers Just Passed America’s Strongest AI Safety Bill
9. AI 음악, 실제로 음악 산업에 영향 주고 있나? 업계 현황 진단
Suno·Udio 등 AI 음악 생성 툴의 품질이 1년 전 대비 급격히 향상됐다는 인식이 확산되는 가운데, ‘실제 산업 충격은 아직 초기 단계인가’에 대한 논의가 활발하다. 현재까지는 로열티 프리 배경음악 라이브러리 시장에서 단가 하락 압력이 가시화되는 수준이며, 주요 아티스트 보컬이나 오케스트라급 편곡을 요구하는 상업 광고 음악은 여전히 사람 작업이 우세하다. 한국 광고·MV 제작에서도 브리프 테스트용 가이드 트랙이나 소셜 쇼트폼용 배경음 제작에 AI 음악 툴 활용이 조용히 늘고 있다. 비용 측면에서 Suno Pro 플랜 기준 월 $8로 월 500곡 생성이 가능해, 레퍼런스 트랙 제작 비용을 사실상 0에 수렴시키고 있다. 현장 관점에선 AI 음악이 음악 감독을 대체할 것인지보다, 클라이언트가 ‘일단 AI 음악으로 가자’고 먼저 요구하기 시작하는 시점이 언제인지를 주목해야 한다.
🔗 원문 보기 — Is AI music actually impacting the music industry yet, or are we still early?
10. RTX 5090 + 64GB RAM 환경에서 실행 가능한 최고 품질 AI 모델 정리
RTX 5090과 64GB RAM으로 업그레이드한 사용자가 ‘이제 어떤 모델을 최고 품질로 돌릴 수 있는가’를 질문하며 커뮤니티 논의가 이어졌다. 31.9GB VRAM의 5090 환경에서는 WAN 2.2 14B·FLUX.1 Dev 풀 FP16·LTX Video 2.3 등을 양자화 없이 구동 가능하며, 이전 세대 12GB 환경에서 불가능하던 풀 프리시전 배치 생성이 현실적이다. 로컬 구동 기준 WAN 14B FP16이 현재 영상 품질 상단으로 평가되고, 이미지는 FLUX.1 Dev 풀 모델이 기준점이다. 다만 RTX 5090은 국내 시판가 400만 원대 이상으로, 투자 대비 효용은 반복 생성 볼륨이 높은 팀에게만 정당화된다. 현장 관점에선 월 구독 클라우드(Kling·Runway·Pika)와 로컬 5090 운용 비용 분기점을 계산하면, 하루 100컷 이상 생성하는 팀부터 로컬이 유리해지기 시작한다.
📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!
매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만