오늘의 AI 뉴스 — 2026/05/02 (토)

AI 영상·이미지·생성 도구 분야의 오늘(2026/05/02) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. 7개 AI 영상 모델 이커머스 광고 실전 비교—Kling·Sora·Seedance 수치 공개

광고 제작 실무자가 Seedance, Sora, Kling 3, Kling 2.1, Runway, Hailuo, Pika 총 7종을 이커머스 광고 제작 관점에서 직접 테스트하고 프롬프트·유즈케이스별 결과를 공개했다. 단순 화질 비교가 아니라 제품 클로즈업 유지력, 텍스트 가독성, 렌더 속도, 비용 대비 완성도까지 항목별로 정리한 것이 특징이다. 광고·커머셜 영상을 만드는 현장에서 ‘어떤 모델을 언제 쓸지’ 판단 기준이 없어 헤매는 경우가 많은데, 이 정도 비교표면 툴 선택 기준을 잡기에 충분하다. 현장 관점에선 모델 만능론보다 ‘이 컷엔 이 모델’이라는 분업 체계를 먼저 세우는 게 실제 납기를 줄인다.

푸른 냉광이 흐르는 실리콘 회로 기판의 극단적 클로즈업, 로컬 연산과 데이터 흐름을 상징하는 추상적 오버헤드 매크로 샷

🔗 원문 보기 — I Tested top 7 AI Video Model for Ecom Ads. Here is my honest breakdown. [PROMPTS + USE CASES]

2. Apple Silicon용 무료 로컬 영상 생성 앱 ‘Phosphene’, LTX 2.3 지원

Phosphene은 Apple Silicon Mac에서 LTX Video 2.3을 로컬로 구동하는 무료 데스크톱 앱으로, 인터넷 연결·API 비용 없이 영상을 생성할 수 있다. M1/M2/M3/M4 계열 맥에서 작동하며 별도 ComfyUI 설치 없이 패널 형태로 바로 사용 가능하다. 클라우드 크레딧 소진 걱정 없이 반복 테스트가 가능하다는 점이 핵심 장점이지만, Apple GPU 특성상 VRAM 제약과 ROCM 미지원으로 영상 해상도·길이에 현실적인 한계가 있다. 현장 관점에선 클라이언트 미팅용 빠른 프리비즈 생성이나 오프라인 환경 촬영 현장에서 레퍼런스 뽑을 때 써볼 만한 옵션이다.

🔗 원문 보기 — Phosphene — local video and audio generation for Apple Silicon ( LTX2.3 )

3. ComfyUI용 영상 데이터셋 제작 워크플로 팩 ‘Video Dataset Factory’ 공개

LTX 2.3 풀 파인튜닝 작업 중 데이터셋 수집·정제 과정이 병목임을 확인한 개발자가 ComfyUI 전용 영상 데이터셋 큐레이션·생성 워크플로 팩을 무료 공개했다. 영상 클리핑, 품질 필터링, 캡셔닝, 학습용 포맷 변환까지 파이프라인을 단일 워크플로로 연결한 구성이다. 2D 애니메이션 파인튜닝을 타깃으로 개발됐지만 실사 영상 파인튜닝에도 그대로 적용할 수 있다. 현장 관점에선 커스텀 스타일 영상 모델을 직접 만들려는 소규모 스튜디오가 데이터 준비 공수를 절반 이하로 줄일 수 있는 실용적인 도구다.

🔗 원문 보기 — Video Dataset Factory

4. LTX 2.3 gguf 증류 워크플로—8개월 전 대비 생성 모션 정밀도 체감 비교

ComfyUI 사용자가 LTX 2.3 distilled gguf 기반 ‘Prompt Relay’ 워크플로를 공개하며, 8개월 전 Wan 2.2에서 원하는 모션을 얻기 위해 10회 이상 반복 생성하던 것과 현재 정밀도를 직접 비교했다. gguf 경량화 덕분에 소비자급 GPU에서도 실용적인 속도로 구동되며, 프롬프트 릴레이 방식으로 복잡한 모션 시퀀스를 연속 제어하는 방법론을 함께 제시했다. LTX 2.3은 현재 로컬 영상 생성 워크플로의 사실상 기준 모델로 자리잡고 있다. 현장 관점에선 클라우드 없이 모션 컨트롤까지 챙기려는 제작자에게 현재 시점에서 가장 현실적인 로컬 옵션이다.

🔗 원문 보기 — LTX-2.3 Prompt Relay (distilled gguf workflow)

5. Anima용 3단계 올인원 LoRA 빌더 공개—영상→태깅→학습 자동화

영상 파일을 입력하면 프레임 추출→자동 태깅→LoRA 학습까지 3단계를 하나의 파이프라인으로 처리하는 Anima 전용 LoRA 빌더가 공개됐다. 기존에 스크린샷 수작업 캡처와 태그 파일 수동 작성에 소요되던 시간을 대폭 줄이는 것이 핵심이며, Anima 생태계 확산을 유도하려는 의도도 명시적으로 포함돼 있다. 특정 인물이나 제품의 일관된 비주얼을 영상에 적용해야 하는 광고·뮤직비디오 제작자에게 직접적으로 유용한 도구다. 현장 관점에선 LoRA 학습 진입 장벽이 낮아진 건 좋지만, Anima 생태계 종속성은 프로젝트 장기 운영 시 리스크로 고려해야 한다.

🔗 원문 보기 — Built a 3-step all-in-one LoRA builder for Anima (extract -> tag -> train)

6. OpenAI, DALL-E 공식 은퇴—NightCafe가 이미지 생성 역사로 정리

OpenAI가 DALL-E를 공식 은퇴시키면서 AI 이미지 생성 플랫폼 NightCafe가 DALL-E 헌정 콘텐츠를 게재했다. DALL-E는 2021년 첫 등장 이후 텍스트→이미지 생성 시장의 초기 기준점이었으나, Flux·Imagen·Stable Diffusion 계열에 시장 주도권을 내준 상태였다. OpenAI는 현재 이미지 생성을 gpt-image-1(GPT-4o 기반)으로 통합 운영 중이며, DALL-E API는 단계적으로 종료된다. 현장 관점에선 이미 실무에서 DALL-E를 쓰는 팀은 거의 없었겠지만, API 연동으로 자동화 파이프라인을 구성해 둔 곳은 gpt-image-1 마이그레이션 일정을 지금 확인해야 한다.

🔗 원문 보기 — A farewell to DALL-E: A Eulogy in Pixels

7. CapCut, 사용자 콘텐츠로 AI 학습 약관 논란—Suno 사용자 주의 경고

한 사용자가 CapCut의 이용약관을 분석해 업로드한 콘텐츠를 AI 학습에 활용할 수 있는 조항이 포함돼 있다며 Suno 커뮤니티에 경고를 게시했다. 음악 생성물을 CapCut으로 편집·업로드할 경우 해당 오디오가 ByteDance 측 AI 모델 학습 데이터로 귀속될 수 있다는 것이 주요 우려다. 한국 시장에서도 CapCut은 숏폼 영상 편집 도구로 광범위하게 쓰이고 있어 음악·영상 저작물 처리 방식에 대한 재확인이 필요하다. 현장 관점에선 클라이언트 납품물이나 미공개 시안을 CapCut에 올리는 습관이 있다면 약관을 직접 읽어보는 게 더 이상 선택이 아니다.

🔗 원문 보기 — Don’t use CapCut. They steal your content and train their AI with it.

8. Blender 재단, Anthropic 기부금 정책 수정—AI 활용 범위 공식 입장 발표

Blender 재단이 Anthropic으로부터 기부금을 받은 사실이 알려진 후 커뮤니티 반발이 이어지자, 기부 수용 기준을 수정하고 AI가 Blender 로드맵에서 어떤 역할을 하는지 공식 입장을 발표했다. 핵심은 ‘AI 도구를 제작 파이프라인에 통합할 수 있지만 창작의 주도권은 인간에게 있어야 한다’는 원칙과 오픈소스 정책 유지다. Blender는 3D·VFX 파이프라인에서 한국 중소 제작사와 프리랜서의 핵심 툴인 만큼, 향후 AI 기능 내장 방향성이 워크플로에 직접 영향을 미친다. 현장 관점에선 Blender가 AI를 어디까지 흡수하느냐에 따라 서드파티 AI 플러그인 생태계 판도가 크게 달라질 수 있다.

🔗 원문 보기 — Blender Clarifies AI Policy and Amends Anthropic Donation

9. VAE OOM 오류 실용 해결책—RX 6800 + ROCM 7.2 환경 LTX 2.3 영상 생성

RX 6800(16GB VRAM) + DDR5 32GB Linux 환경에서 LTX 2.3 영상 생성 시 반복 발생하는 VAE Out-of-Memory 오류를 해결한 트릭이 공유됐다. 낮은 양자화 설정에서도 OOM이 발생하던 원인이 VAE 디코딩 단계의 메모리 스파이크임을 확인하고, 타일 VAE 디코딩 분할 처리로 해결하는 방법이 구체적으로 제시됐다. AMD GPU 기반 로컬 영상 생성 환경은 NVIDIA 대비 레퍼런스가 부족해 같은 오류로 시간을 낭비하는 경우가 많다. 현장 관점에선 AMD 그래픽카드로 로컬 영상 생성을 시도 중인 제작자라면 이 설정을 먼저 적용하고 시작하는 게 몇 시간을 아끼는 지름길이다.

🔗 원문 보기 — I found an useful Trick to prevent VAE OOM Errors

10. DiT 기반 영상 오브젝트 제거 논문 YOSE—토큰 선택으로 연산량 대폭 절감

arXiv에 공개된 YOSE(You Only Select Essential Tokens) 논문은 Diffusion Transformer 기반 영상 오브젝트 제거 작업에서 필수 토큰만 선택적으로 처리해 연산 비용을 줄이면서도 품질을 유지하는 방법을 제안했다. 기존 DiT 영상 생성 모델이 오브젝트 제거 시 전체 프레임 토큰을 처리해 속도가 느리던 문제를 타깃으로 하며, 효율적인 토큰 선택 전략으로 실시간에 가까운 처리 속도를 목표로 한다. 실무에서 촬영 후 배경 오브젝트 제거는 여전히 후반 작업 시간의 상당 부분을 차지하는 영역이다. 현장 관점에선 아직 논문 단계이지만 ComfyUI 구현체가 나오면 로토스코핑 공수를 실질적으로 줄일 수 있는 기술로 주목할 만하다.

🔗 원문 보기 — YOSE: You Only Select Essential Tokens for Efficient DiT-based Video Object Removal


📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만

댓글 남기기