오늘의 AI 뉴스 — 2026/05/28 (목)

AI 영상·이미지·생성 도구 분야의 오늘(2026/05/28) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. YouTube, AI 생성 영상 자동 라벨링 시작 — 크리에이터 신고 의존 종료

YouTube가 사실적 묘사 AI 영상에 대해 크리에이터의 자율 공시 대신 플랫폼 자동 라벨링을 도입한다고 발표했다. 애니메이션·비사실적 영상이나 AI 비중이 낮은 콘텐츠는 예외가 적용되지만, 상업 광고·뮤직비디오에 포토리얼리스틱 AI를 사용한 경우 강제 표시 대상이 될 가능성이 높다. 한국 광고주와 브랜드 채널을 운영하는 제작사라면 납품 전 AI 활용 범위를 재점검해야 할 시점이다. 현장 관점에선 ‘몰랐다’는 말이 더 이상 통하지 않는 구조가 됐고, 클라이언트 계약서에 AI 사용 고지 조항을 명문화하는 게 선제 대응이다.

🔗 원문 보기 — YouTube to begin automatically labeling AI videos

2. ElevenLabs, 장르 전환 가능한 음악 생성 모델 출시 — 구간 재생성 지원

ElevenLabs가 트랙 중간에 장르를 전환할 수 있는 신규 음악 생성 모델을 공개했다. 특정 구간만 선택해 재생성해도 나머지 트랙에 영향을 주지 않는 비파괴 편집 방식을 지원하며, 이는 기존 Suno·Udio 대비 후반 편집 유연성에서 차별점을 갖는다. 뮤직비디오나 광고 BGM 작업 시 장면 전환 구간의 분위기만 바꾸는 식의 활용이 가능해진다. 현장 관점에선 완성도보다 편집 제어권이 실무에 더 직결되는데, 구간 단위 재생성 기능은 납기 촉박한 광고 후반 작업에 실질적 시간 절감 여지가 있다.

🔗 원문 보기 — ElevenLabs’ new music-generation model can switch genres mid-track

3. InvokeAI 6.13 출시 — 커뮤니티 단독 개발, Anima·GPT Image API 지원

InvokeAI가 6.13 버전을 출시했다. 상업 법인 없이 30인 이상 자원봉사자로만 이뤄진 순수 커뮤니티 릴리즈로, Anima 및 Qwen Image 풀 지원, GPT Image 등 외부 API 모델 연동, 프롬프트 확장 및 이미지→프롬프트 역변환, 라소·폴리곤 선택 툴이 추가됐다. 상업 지원이 끊긴 상태에서도 기능 면에서 ComfyUI와 경쟁 가능한 수준을 유지하고 있다는 점이 주목할 부분이다. 현장 관점에선 ComfyUI ToS 논란(워크플로 수집 조항)이 겹치면서 로컬 파이프라인의 대안으로 InvokeAI를 다시 보는 팀이 늘 수 있다.

🔗 원문 보기 — InvokeAI 6.13 just released, its largest community-driven release ever. Adds full support for Anima & Qwen Image, support for API models (like GPT Image), support for Prompt Expansion & Image To Prompt, lasso & polygon tools, overhauled docs website and more

4. ComfyUI 신규 ToS — 클라우드·API 유저 워크플로 구조 수집 허용 조항 추가

ComfyUI가 펀딩 이후 서비스 약관을 조용히 업데이트하면서 클라우드·API·엔터프라이즈 사용자의 워크플로 구조와 프롬프트 분류 데이터 수집을 허용하는 조항이 포함됐다. 로컬 설치 사용자는 직접 적용 대상이 아니지만, ComfyUI Cloud나 API 기반으로 파이프라인을 구축한 스튜디오는 클라이언트 기밀 워크플로가 외부로 노출될 수 있다는 리스크를 인지해야 한다. 현장 관점에선 외주 납품용 독점 워크플로를 클라우드에 올리는 행위 자체를 재검토할 시점이며, 로컬 전용 운영 방침을 명문화하는 스튜디오가 늘어날 것으로 보인다.

🔗 원문 보기 — ComfyUI Won’t Train on Your Art. Just on How You Make It.

5. Wan 2.2, LTX 2.3 상대로 성능 우위 지속 — 실사용 비교 데이터

커뮤니티 벤치마크에서 Wan 2.2가 LTX 2.3 대비 일관된 영상 품질 우위를 보이고 있다는 결과가 공유됐다. Wan 2.2로 3초 클립을 1샷씩 생성하고 LTX 2.3으로 4샷 멀티프롬프트를 시도한 비교에서 Wan 2.2의 캐릭터 일관성과 모션 자연스러움이 앞서는 것으로 평가됐다. 다만 A100 GPU 기준 10초 영상 생성에 최소 45분이 소요된다는 실사용 보고가 있어, 납기가 촉박한 상업 작업엔 클라우드 GPU 비용 계산이 선행돼야 한다. 현장 관점에선 Wan 2.2가 품질 기준선 역할을 하고 있지만 속도 문제는 여전히 발목을 잡는 현실이다.

🔗 원문 보기 — Wan2.2 continues to outperform LTX2.3

6. Wan 2.2 W4A4 양자화 모델 공개 — 고/저 분리 없이 단일 모델로

JunhaoWu 팀이 Wan 2.2 I2V A14B 모델을 W4A4 양자화한 버전을 HuggingFace에 공개했다. Timestep-Aware SVDQuant-GPTQ 기법을 적용해 기존 high/low 분리 방식 없이 단일 모델로 처리하며 VRAM 사용량과 생성 시간을 동시에 줄인다고 밝혔다. A100 기준 45분이 걸리던 10초 영상 생성 시간 단축에 직접적인 영향을 줄 수 있는 업데이트다. 현장 관점에선 고성능 GPU 없이 Wan 2.2를 실무에 쓰고 싶었던 팀에게 실질적인 진입 장벽 낮추기가 시작된 것으로 볼 수 있다.

🔗 원문 보기 — A Wan 2.2 post-training Quant . 1 model instead of high + low

7. Krea 2 Image, 파트너 노드 통해 정식 제공 — 크리에이티브 방향 제어 특화

Krea의 두 번째 이미지 모델 ‘Krea 2 Image’가 Partner Nodes를 통해 정식 제공되기 시작했다. 단순 텍스트 프롬프트 이상으로 색감·분위기·크리에이티브 방향을 세밀하게 제어하는 데 초점을 맞춘 모델로, 광고 비주얼 개발 단계에서 무드보드 구현 용도로 주목받고 있다. 접근 방식이 Flux 계열과 달리 스타일 일관성 유지 쪽으로 설계됐다는 점이 특징이다. 현장 관점에선 아직 API 접근 비용과 한국어 프롬프트 반응성이 확인되지 않았고, 실무 도입 전 소규모 테스트를 먼저 해보는 게 맞다.

🔗 원문 보기 — Krea 2 Image is now available via Partner Nodes

8. DEMON 오픈소스 공개 — ComfyUI용 음악 생성 디퓨전 엔진

오디오 리액티브 ComfyUI 노드 개발자 Ryan이 ‘DEMON(Diffusion Engine for Musical Orchestrated Noise)’을 오픈소스로 공개했다. ACEstep의 ComfyUI 확장 지원을 포함하며, 텍스트·이미지 입력 기반 음악 생성을 ComfyUI 파이프라인 안에서 직접 처리할 수 있도록 설계됐다. 영상-음악 동시 생성 워크플로를 단일 파이프라인으로 묶고 싶은 팀에게 실용적인 선택지가 추가됐다. 현장 관점에선 Suno·ElevenLabs처럼 외부 서비스에 의존하지 않고 로컬에서 BGM 생성을 닫힌 루프로 처리하려는 스튜디오에 가장 빠르게 가치가 생기는 툴이다.

🔗 원문 보기 — DEMON: Diffusion Engine for Musical Orchestrated Noise

9. Capture One 전 제품 6% 가격 인상 예고 — 구독·영구 라이선스 모두 적용

Capture One이 Pro, All-in-One, Studio 전 라인업에 걸쳐 월정액·연정액·영구 라이선스 구분 없이 6% 가격 인상을 공식 발표했다. 구체적 시행 일정은 아직 공개되지 않았지만, 영구 라이선스 구매를 고려하던 사용자라면 인상 전 구입을 서두르는 게 유리하다. Lightroom 대안으로 Capture One을 쓰는 스틸 기반 영상 제작자나 커머셜 사진팀에 직접적인 비용 영향이 있다. 현장 관점에선 6%는 숫자상 작아 보이지만 다중 시트 스튜디오 라이선스 기준으로는 적지 않은 금액이고, 대안 RAW 워크플로를 검토할 명분이 하나 더 생긴 셈이다.

🔗 원문 보기 — Capture One to Increase All Product Prices By 6%

10. 소리담(Sori-Dam) 공개 — 완전 로컬·무료 한국어 AI 음성 생성기

VoxCPM2 모델 기반의 완전 로컬 AI 음성 생성·복제 앱 ‘소리담’이 한국 개발자에 의해 공개됐다. 인터넷 연결 없이 기기 내에서만 동작하며 100% 무료로 제공된다. 아직 버그가 있고 완성도가 높지 않다고 개발자 스스로 밝혔지만, 외부 API 없이 한국어 보이스오버 프로토타입이나 교육용 나레이션 제작에 쓸 수 있는 로컬 옵션이라는 점에서 주목할 만하다. 현장 관점에선 ElevenLabs 유료 플랜 없이 로컬에서 빠르게 한국어 더빙 시안을 뽑아야 하는 소규모 팀의 비용 절감 용도로 먼저 테스트해볼 가치가 있다.

🔗 원문 보기 — Sori-Dam: A completely free, 100% local AI Voice Generator powered by VoxCPM2 (Runs fully offline!)

📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만