오늘의 AI 뉴스 — 2026/04/27 (월)

AI 영상·이미지·생성 도구 분야의 오늘(2026/04/27) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. MiniMax Music 2.6 실사용 후기: AI 커버 기능 솔직 평가

MiniMax가 Music 2.6을 출시했으며 이번 업데이트의 핵심은 ‘AI Cover’ 기능이다. 실사용자 후기에 따르면 Suno의 커버 기능과 비교했을 때 완성도 면에서 경쟁력 있는 수준이라는 평가가 나왔다. 뮤직비디오 제작 시 기존 곡을 AI로 리커버링해 BGM으로 활용하거나 클라이언트 레퍼런스 트랙을 대체하는 용도로 쓸 수 있다. 저작권 리스크를 줄이면서 레퍼런스에 가까운 사운드를 뽑아야 하는 광고·MV 작업자라면 테스트해볼 가치는 있다. 현장 관점에선 커버 품질보다 상업 라이선스 조건이 아직 불명확하다는 점이 더 큰 변수다.

🔗 원문 보기 — My honest experience with MiniMax Music 2.6

2. Voicebox: ElevenLabs 대체 로컬 TTS, GitHub 스타 2.2만 돌파

오픈소스 로컬 TTS 툴 Voicebox가 GitHub 스타 2만 2천 개를 넘어서며 ElevenLabs 대안으로 주목받고 있다. 월 22~99달러인 ElevenLabs 유료 플랜 대비 완전 무료·로컬 실행이 가능하며 오디오 데이터가 외부 서버로 나가지 않는다. 한국 광고·기업 영상 시장에서 내레이션 VO 외주 비용 절감 수단으로 쓸 수 있고, 클라이언트 NDA가 걸린 프로젝트에서 데이터 보안 이슈도 해소된다. 다만 로컬 실행이므로 GPU 사양과 한국어 음성 품질은 별도 검증이 필요하다. 현장 관점에선 한국어 억양 자연스러움이 ElevenLabs 수준에 도달하는지가 도입 결정의 핵심이다.

🔗 원문 보기 — Deep Dive: Voicebox — The free, local-first ElevenLabs alternative that just hit 22K stars.

3. LTX 2.3 + ACE 1.5로 2분짜리 뮤직비디오 자동 생성 앱 ‘LtxMTV’ 공개

ComfyUI 기반 앱 모드 워크플로우 LtxMTV가 공개됐다. ACE 1.5 / 4B와 LTX 2.3 Distilled FP8을 조합해 단일 파이프라인에서 최대 2분 분량의 뮤직비디오를 생성한다. 두 모델 모두 로컬 다운로드 기반이며 Civitai에서 무료로 내려받을 수 있다. 짧은 인디 MV나 소셜 클립을 빠르게 뽑아야 하는 소규모 제작사에게 즉시 적용 가능한 파이프라인이다. 현장 관점에선 2분 내내 캐릭터 일관성을 유지하는지가 관건이고, FP8 양자화 품질 저하를 얼마나 감수할 수 있느냐가 도입 기준이 된다.

🔗 원문 보기 — LtxMTV is a APP MODE 2-Minutes Music Video Generator

4. GPT Image 2.0 + LTX 2.3 조합 실사용 결과 공유

GPT Image 2.0으로 레퍼런스 이미지를 생성한 뒤 ComfyUI의 LTX 2.3으로 영상화하는 2단계 파이프라인을 실사용한 결과가 커뮤니티에 공유됐다. 사용자는 ‘결과가 상당히 좋았다’고 평가했으며, 이미지 생성 일관성과 영상 품질 모두 기존 단일 모델 대비 향상됐다는 피드백이다. 별도 파인튜닝 없이 즉시 사용 가능한 조합이라는 점이 실무 진입 장벽을 낮춘다. 현장 관점에선 GPT Image 2.0이 유료 API 과금 구조임을 감안해, 반복 생성이 많은 작업에서는 비용 계산을 먼저 해봐야 한다.

🔗 원문 보기 — I used GPT Image 2.0 to generate images and LTX 2.3 in ComfyUI to generate videos, and the results were excellent.

5. LTX 2.3 LoRA 학습, RTX 5090에서 7시간 — Ostris AI Toolkit 실측치

사용자가 RTX 5090 환경에서 Ostris AI Toolkit을 이용해 LTX 2.3 LoRA 학습을 완료한 실측 결과를 공유했다. 소요 시간은 약 7시간이며, 기존 방식에서 발생하던 ‘temporal collapse(시간적 붕괴)’ 문제와 낮은 정확도 문제를 해결하는 커스텀 설정을 적용했다. 5090 기준이라는 점에서 3090·4090 사용자는 학습 시간이 더 길어질 수 있다. 현장 관점에선 LTX 2.3 캐릭터 LoRA 직접 학습을 고려하고 있다면 지금은 5090급 이상 또는 클라우드 GPU 비용을 먼저 따져봐야 하는 타이밍이다.

🔗 원문 보기 — LTX2.3 in Ostris Ai toolkit on a 5090 Training done in 7 hours … I went Thanos way and I said fine … I’ll do it myself

6. UniGeo 오픈소스 공개: Wan2.2 기반 카메라 제어 이미지 편집 프레임워크

Wan2.2와 VGGT를 결합한 오픈소스 프레임워크 UniGeo가 공개됐다. 기하학적 가이던스를 통해 카메라 앵글을 정밀하게 제어하면서 이미지를 편집할 수 있는 것이 핵심이다. 비디오 모델을 이미지 편집 엔진으로 활용하는 방식으로, 기존 인페인팅 대비 공간 일관성이 높다는 점이 특징이다. 제품 광고 영상에서 카메라 무빙을 유지한 채 배경이나 오브젝트를 교체해야 하는 VFX 작업에 응용 가능성이 있다. 현장 관점에선 아직 연구 단계 코드라 ComfyUI 노드로 안정화되기까지 시간이 필요하며, 실무 투입 전 재현성 테스트가 필수다.

🔗 원문 보기 — [Open Source] UniGeo: Unifying Geometric Guidance for Camera-Controllable Image Editing via Video Models (Powered by Wan2.2 & VGGT)

7. Flux-2-Klein-9B로 레퍼런스 이미지 기반 오브젝트 스와핑 + 4K 업스케일

SAM2 세그멘테이션과 Flux-2-Klein-9B를 조합해 레퍼런스 이미지 기반 오브젝트 교체를 구현한 ComfyUI 워크플로우가 공유됐다. 최종 출력은 SEEDVR로 4K까지 업스케일하는 파이프라인이다. 광고 제품 교체나 소품 변경 작업에서 별도 마스킹 작업 없이 빠르게 시안을 뽑는 용도로 바로 적용 가능하다. 무료 오픈소스 조합이라는 점에서 비용 부담이 없고 로컬 실행이 가능하다. 현장 관점에선 SAM2 세그멘테이션 정밀도가 복잡한 경계면에서 얼마나 버텨주느냐가 실무 투입의 갈림길이 된다.

🔗 원문 보기 — Object Swapping flux-2-klein-9b

8. ComfyUI 신규 3종 노드: Qwen3-TTS·OmniVoice·Z-Image, Triton 커널 가속

단일 개발자가 Triton 커스텀 커널 기반의 ComfyUI 노드 3종을 동시 공개했다. Qwen3-TTS(텍스트-음성), OmniVoice(멀티모달 음성), Z-Image(이미지 생성) 패키지로 구성되며 ComfyUI Manager를 통해 바로 설치 가능하다. Triton 커널 최적화로 기존 대비 추론 속도 향상이 포인트지만 구체적인 벤치마크 수치는 아직 미공개다. 영상 제작 파이프라인에서 VO 생성과 이미지 생성을 ComfyUI 단일 환경 안에서 처리하려는 작업자에게 유용하다. 현장 관점에선 세 패키지 모두 초기 릴리즈라 안정성 확인 후 프로덕션 파이프라인에 투입하는 것이 순서다.

🔗 원문 보기 — [3 New Nodes] Triton-fused ComfyUI nodes — Qwen3-TTS, OmniVoice, and Z-Image (custom kernel acceleration, all installable via Manager)

9. 3D 모델 → Seedance 2 렌더: 애니메이션 MV 파이프라인 실사례

3D 모델을 Seedance 2에 입력해 애니메이션 스타일 영상으로 변환하는 파이프라인의 실제 뮤직비디오 결과물이 두 건 커뮤니티에 공유됐다. ‘Crazy Rari’ 프로젝트는 3D-to-AI 애니메이션 접근법을 사용했으며, 별도 케이스도 동일한 방식으로 Seedance 2 렌더링 결과를 공개했다. Seedance 2가 3D 모델의 구조적 일관성을 유지하면서 스타일 변환에 강점을 보이는 용례가 쌓이고 있다는 점에서 의미 있다. 현장 관점에선 Blender 등 3D 툴을 이미 쓰는 팀이라면 Seedance 2를 렌더 후처리 단계에 끼워넣는 하이브리드 워크플로우가 현실적인 진입점이다.

🔗 원문 보기 — 3D-to-AI anime using Seedance 2 for “Crazy Rari”

10. 리더보드 조작 경고: ‘Happy Horse 1.0’ 출시 전 사전 점수 조작 정황

내일(4월 28일) 공식 출시 예정인 Happy Horse 1.0이 출시 전 리더보드 점수를 인위적으로 끌어올린 정황이 포착됐다는 주장이 커뮤니티에 제기됐다. 해당 모델은 클로즈드소스로 출시될 가능성이 높은 것으로 알려졌다. AI 영상·이미지 툴 선택 시 벤치마크 순위를 맹신하는 관행에 대한 경고성 사례다. 현장 관점에선 어떤 모델이든 리더보드 수치보다 자신의 실제 작업물 샘플로 직접 테스트하는 것이 유일하게 믿을 수 있는 기준이고, 이번 사례는 그걸 다시 한번 확인시켜준다.

🔗 원문 보기 — One more reason to never trust leaderboards.

매일 오전 9시 발행 · 채널 @reelai_kr 구독 환영