오늘의 AI 뉴스 — 2026/05/19 (화)

AI 영상·이미지·생성 도구 분야의 오늘(2026/05/19) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. LTX Director 무료 공개 — ComfyUI에서 LTX 2.3 고급 제어 가능

LTX 2.3용 ComfyUI 커스텀 노드 ‘LTX Director’가 무료로 공개됐다. 튜토리얼에 따르면 카메라 모션, 씬 전환, 레퍼런스 이미지 활용 등 주요 기능을 단일 노드 세트로 통합 제어할 수 있다. 별도 API 비용 없이 로컬 환경에서 구동되며, 기존 WanVACE나 Wan 계열 워크플로와 병행 운용도 가능하다. 한 가지 주의할 점은 LTX 계열 모델 자체가 아직 모션 일관성에서 들쑥날쑥한 결과를 내는 만큼, 툴이 무료라고 해서 완성도가 무료 수준을 넘어서리란 보장은 없다. 현장 관점에선 무료 로컬 도구 중 카메라 제어 기능이 이 정도 통합된 사례는 드물어, 단가 압박이 있는 숏폼 프로젝트에 먼저 테스트해볼 만하다.

🔗 원문 보기 — How to use LTX Director – A Free Tool for Creating Advanced LTX 2.3 Videos in ComfyUI

2. ComfyUI에 포토샵식 리퀴파이 편집기 ‘Olm Liquify’ 등장

ComfyUI 내부에서 실시간 워핑 편집을 가능케 하는 커스텀 노드 ‘Olm Liquify’가 공개됐다. 포토샵의 Liquify 필터처럼 드래그로 픽셀을 밀고 당기는 인터랙티브 UI를 ComfyUI 워크스페이스 안에서 구현한다. 별도 외부 툴로 왔다 갔다 할 필요 없이 생성 이후 미세 보정을 인라인으로 처리할 수 있다는 점이 핵심이다. 다만 현재는 이미지 단위 편집이며 비디오 프레임 시퀀스에 대한 일괄 적용 기능은 공식 확인되지 않았다. 현장 관점에선 인물 실루엣 교정이나 소품 위치 미세 조정 같은 후보정 단계에서 외부 툴 전환 횟수를 줄여주는 실용적인 노드다.

🔗 원문 보기 — Olm Liquify – An interactive, Photoshop-style Liquify editor inside ComfyUI

3. Imagen 4, 6월 30일 서비스 종료 — 디즈니 르네상스 스타일 재현 공백 생긴다

Google의 Imagen 4 및 Imagen 4 Ultra가 2025년 6월 30일부로 공식 종료된다. 현재 AI 이미지 모델 중 1990년대 디즈니 르네상스 특유의 수채화풍 채색과 소프트 포커스를 신뢰도 있게 재현할 수 있는 거의 유일한 모델로 평가받아 왔다. 대안으로 Illustrious 2.0에 LoRA를 증류하려는 시도가 있으나 결과가 아직 불안정하다는 현장 보고가 올라오고 있다. 해당 스타일이 필요한 애니메이션 광고나 패밀리 콘텐츠 프로젝트를 앞두고 있다면 6월 말 전에 레퍼런스 이미지를 미리 생성해두는 게 현실적인 대응이다. 현장 관점에선 특정 미감을 한 모델에 의존하는 구조 자체가 리스크임을 다시 한번 확인시켜주는 사례다.

🔗 원문 보기 — Trying to distill the soon-to-be-sunset Imagen 4 to a LoRA for Illustrious 2.0 but the result is a bit wonky, would appreciate some pointers

4. 소규모 AI 영상 스튜디오 4개월 실제 비용 분석 — 월 100~150클립 기준

단편 AI 영상 스튜디오를 운영하는 제작자가 4개월간 모델·API 조합별 실제 비용을 공개했다. 월 100~150클립, 8~12개 클라이언트 브리프를 소화하는 규모에서 모델 및 API 비용이 주요 변수임을 데이터로 보여준다. 구체적으로는 캐릭터 일관성 유지가 필요한 클립일수록 단가가 급등하며, 여러 모델을 혼합해 쓸 때 파이프라인 유지 비용이 예상보다 크다는 점을 지적한다. 국내 단가 구조와 직접 대입하기 어렵지만, API 과금 방식 모델과 로컬 구동 모델의 손익분기점을 따져보는 데 참고할 수 있는 실측 데이터다. 현장 관점에선 AI 영상 외주 견적을 클립 단위로 낼 때 이 수치를 벤치마크로 삼아볼 수 있다.

🔗 원문 보기 — Video studio cost breakdown across model + API provider mix (4 months in)

5. 소더버그, 존 레논 다큐에 AI 이미지 사용 공식 인정

스티븐 소더버그 감독이 신작 다큐멘터리 ‘John Lennon: The Last Interview’에서 AI 생성 이미지를 활용했다고 직접 밝혔다. 아카이브 footage가 부족한 시대적 장면을 채우는 용도로 사용했으며, 소더버그는 이를 ‘미학적 선택’으로 설명했다. 다큐멘터리 분야에서 오스카 급 감독이 AI 이미지 사용을 공개 인정한 사례는 드물어 업계 기준점이 될 가능성이 있다. 한국 방송·OTT 다큐 제작사 입장에서는 AI 이미지 사용 공시 기준과 저작권 리스크를 선제적으로 검토할 필요가 생겼다. 현장 관점에선 ‘거장도 쓴다’는 레퍼런스가 생긴 만큼, 클라이언트 설득보다 계약서상 고지 조항 정비가 더 급하다.

🔗 원문 보기 — Steven Soderbergh Confirms Use of AI Images in ‘John Lennon: The Last Interview’ Documentary

6. NVIDIA Cosmos Predict 2.5, LoRA/DoRA로 로봇 영상 파인튜닝 공개

NVIDIA가 자사 Cosmos Predict 2.5 모델을 LoRA 및 DoRA 기법으로 파인튜닝하는 방법을 공식 공개했다. 주된 타깃은 로봇 동작 영상 생성이지만, 동일한 파인튜닝 파이프라인을 제품 시연 영상이나 산업 광고 영상 제작에 전용하는 것도 기술적으로 가능하다. Cosmos 계열은 로컬 구동 시 고사양 GPU가 필수이며, A100 이상 환경을 전제로 한다. 국내에서는 클라우드 GPU 임대 비용이 변수가 되는데, 단발성 프로젝트보다는 반복 납품이 있는 기업 고객을 대상으로 할 때 ROI가 나오는 구조다. 현장 관점에선 로봇·제조업 클라이언트 영상을 주로 다루는 스튜디오라면 파인튜닝 비용 대비 납품 단가를 먼저 계산해봐야 한다.

🔗 원문 보기 — Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

7. Google I/O 2026 시청 방법 및 Gemini·Android XR 발표 예고

Google I/O 2026이 임박했으며, 주요 발표 예정 항목은 Search 업데이트, Android 신버전, Gemini 고도화, Android XR 스마트 글라스다. 영상 제작 툴 관점에서는 Veo 3 혹은 Imagen 후속 모델 관련 발표 가능성이 있어 주목할 필요가 있다. 특히 Imagen 4가 6월 30일 종료를 앞둔 상황에서 후속 모델 로드맵이 공개될 경우 대체 워크플로 전환 시점을 조율할 수 있다. 라이브 스트림은 Google 공식 유튜브 채널에서 무료 시청 가능하다. 현장 관점에선 Veo 관련 API 요금 변경이나 새 기능 발표 여부가 이번 I/O에서 가장 실무적으로 중요한 포인트다.

🔗 원문 보기 — How to Watch Google I/O 2026

8. 논문: 비디오 확산 모델에 검증 가능한 보상 신호로 추론 능력 부여

arXiv에 공개된 ‘Video Models Can Reason with Verifiable Rewards’ 논문은 영상 확산 모델이 단순 시각적 그럴듯함을 넘어 물리적 인과관계와 시간적 논리를 추론할 수 있도록 강화학습 기반 보상 신호를 적용하는 방법을 제안한다. 기존 모델들이 물체 낙하, 충돌, 유체 흐름 같은 물리적 사건을 부정확하게 생성하는 문제를 정량적 보상으로 교정하는 접근이다. 즉각적인 상용 툴 반영까지는 시간이 걸리겠지만, Runway나 Kling 같은 모델의 다음 세대 업데이트 방향성과 맞닿아 있다. 광고·뮤직비디오에서 물리 기반 CG를 AI로 대체하려는 시도가 늘고 있는 만큼 이 연구 방향은 실무 적용 가능성이 있다. 현장 관점에선 지금 당장 쓸 수 있는 건 아니지만, 6개월 뒤 모델 선택 기준이 바뀔 수 있다는 신호로 읽어두면 된다.

🔗 원문 보기 — Video Models Can Reason with Verifiable Rewards

9. Wan VACE 모델에 복수 레퍼런스 이미지 입력하는 방법 정리

ComfyUI의 WanVaceToVideo 노드에서 ‘reference_image’ 입력 단자에 퍼스트 프레임 이미지 + 캐릭터 레퍼런스 4장을 동시에 넘기는 방법에 대한 실용적인 논의가 공유됐다. 단일 이미지 입력만 지원하는 것처럼 보이는 노드 구조에서 이미지 배치(batch) 처리를 통해 복수 입력을 우회하는 방식이 핵심이다. 캐릭터 일관성 유지가 관건인 광고 영상이나 숏폼 시리즈 제작 시 Wan VACE의 레퍼런스 이미지 한계가 병목이 돼왔던 만큼 실무 적용 가치가 있다. 다만 입력 이미지 수가 늘어날수록 VRAM 사용량이 선형적으로 증가하므로 24GB 이하 환경에서는 테스트 후 적용을 권장한다. 현장 관점에선 캐릭터 고정 영상 작업에서 Wan VACE 워크플로의 실용성을 끌어올릴 수 있는 팁이다.

🔗 원문 보기 — How to pass multiple reference images to Wan VACE model

10. 머스크, OpenAI 소송 전원일치로 패소 — 항소 예고

일론 머스크가 OpenAI와 샘 알트만을 상대로 제기한 소송에서 캘리포니아 배심원 9명이 전원일치로 머스크 측 패소 판결을 내렸다. 배심원 평의는 2시간 만에 끝났으며, 판사도 즉시 이를 최종 판결로 채택했다. 핵심 패인은 소송 제기 시효 도과였고, 머스크 측은 항소를 예고했다. OpenAI의 비영리→영리 전환 구조 논란은 이번 판결로 법적으로는 일단락됐지만 정치적 공방은 계속될 전망이다. 현장 관점에선 OpenAI API 의존도가 높은 스튜디오라면 법적 불확실성이 줄었다는 점에서 단기적으로 플랜을 바꿀 이유는 없다.

🔗 원문 보기 — Elon Musk Loses Landmark Lawsuit Against OpenAI

📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만