오늘의 AI 뉴스 — 2026/05/04 (월)

AI 영상·이미지·생성 도구 분야의 오늘(2026/05/04) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. LTX 2.3, 6GB VRAM으로 1920×1080 15초 영상 생성 가능

ComfyUI에서 LTX 2.3 모델을 ‘Prompt Relay’ 노드와 조합하면 VRAM 6GB 환경에서 1920×1080 해상도, 최대 15초 영상을 생성할 수 있다는 튜토리얼이 공개됐다. 구간별 프롬프트를 릴레이 방식으로 연결해 긴 영상을 쪼개 생성한 뒤 이어붙이는 구조로, RTX 3060급 카드로도 풀HD 결과물을 뽑을 수 있다는 점이 핵심이다. 같은 날 한 사용자가 손으로 그린 스케치를 LTX 2.3으로 애니메이션화하는 데 성공한 사례도 올라와, i2v 활용 범위가 넓어지고 있음을 보여준다. 현장 관점에선 고가 GPU 없이도 납품 가능한 해상도를 건드릴 수 있게 됐다는 게 실질적인 진전이지만, 15초 분량에 얼마나 걸리는지 렌더 시간 벤치마크는 아직 없다.

푸른 어둠 속 GPU 회로 기판의 극단적 클로즈업 — 차갑고 추상적인 연산의 상징

🔗 원문 보기 — ComfyUI Tutorial: LTX 2.3 Prompt Relay Workflow On 6GB Vram (Res: 1920×1080 Video Length 15 sec)

2. Sulphur 2 + LTX 2.3 10Eros 동시 출시, WAN 대안 부상

Sulphur AI의 ‘Sulphur 2 Base’와 TenStrip의 ‘LTX 2.3 10Eros’가 Hugging Face에 동시 공개됐다. 커뮤니티 반응은 ‘특정 워크플로우에서 WAN을 넘어섰다’는 평가가 나올 만큼 긍정적이며, 두 모델 모두 로컬 실행 기반이다. 아직 광범위한 벤치마크 수치는 없고 커뮤니티 주관 평가에 의존하는 상황이나, WAN 계열에 피로감을 느끼던 사용자들이 빠르게 테스트에 뛰어들고 있다. 현장 관점에선 대안 영상 생성 모델이 늘어나는 건 반가운 일이지만, 실제 커머셜 퀄리티로 쓰려면 한두 주 더 커뮤니티 결과물을 지켜본 뒤 판단하는 게 안전하다.

🔗 원문 보기 — Sulphur 2 AND LTX 2.3 10Eros dropped! AND THEY ARE INCREDIBLE

3. FLUX 2 Klein 9B 기반 스마트폰 스냅샷 포토리얼 LoRA v13 공개

Civitai에 ‘Smartphone Snapshot Photo Reality v13 OMEGA’가 출시됐다. FLUX 2 Klein Base 9B 전용 LoRA로, 개발자는 한 달 이상 기간과 상당한 비용을 투자했다고 밝혔으며 v14 티저도 함께 공개해 연속 업데이트를 예고했다. ‘스마트폰으로 찍은 듯한 자연스러운 실사 질감’을 목표로 하며, 광고·숏폼 콘텐츠의 UGC 스타일 시뮬레이션에 바로 쓸 수 있는 방향성이다. 현장 관점에선 브랜드 광고에서 ‘SNS 바이럴처럼 보이는 영상’ 요청이 늘고 있는 만큼, 이 LoRA의 스틸 레퍼런스 생성 용도는 충분히 실용적이다.

🔗 원문 보기 — RELEASE – The model you’ve all been waiting for – Smartphone Snapshot Photo Reality v13 – OMEGA

4. Wan Animate vs Wan Scail 6클립 직접 비교 영상 공개

동일한 소스 영상과 캐릭터 레퍼런스를 사용해 Wan Animate와 Wan Scail(SCAIL) 각각 원본 + 업스케일 버전까지 총 6개 클립을 나란히 비교한 영상이 올라왔다. 두 모델 모두 WAN 기반이지만 움직임 처리 방식이 달라, 인물 중심 장면과 배경 움직임에서 눈에 띄는 차이를 보인다. 현재 커뮤니티 투표는 Wan Scail 쪽이 업스케일 품질에서 우세한 분위기다. 현장 관점에선 뮤직비디오나 광고 후반 업스케일링 단계에서 어떤 모델을 택하느냐가 최종 납품 퀄리티를 가르는 만큼, 이 비교 영상은 직접 확인해볼 가치가 있다.

🔗 원문 보기 — Wan Animate vs Wan Scail (SCAIL): Which do you prefer? Side-by-side comparison video + upscales

5. FLUX 2 Klein Identity Transfer V3, 얼굴 이식 노드 최종판 출시

‘Identity Feature Transfer V3’가 공개됐다. FLUX 2 Klein 기반의 인물 동일성 이전 노드로, 이전 버전 대비 블록 단위 세부 조정 없이도 작동하도록 인터페이스를 간소화한 것이 핵심 변경점이다. 복잡한 파라미터 없이 레퍼런스 얼굴을 대상 이미지에 자연스럽게 이식할 수 있어, 기존 IP-Adapter 계열보다 진입 장벽이 낮아졌다는 평이다. 현장 관점에선 광고 후반 모델 얼굴 교체나 MV 콘셉트 시안 작업에서 클라이언트 설득용 레퍼런스 이미지를 빠르게 만들 때 실용적으로 쓸 수 있는 수준이다.

🔗 원문 보기 — FLUX.2 Klein Identity Feature Transfer V3 (Final)

6. EasyUI: ComfyUI 노드 없는 오픈소스 GUI 래퍼 정식 공개

ComfyUI를 노드 그래프 없이 사용할 수 있는 데스크톱 전용 오픈소스 UI ‘EasyUI’가 공개됐다. txt2img, img2img, img2vid, vid2vid 워크플로우를 지원하며 파이썬 스크립트 실행, Ollama LLM 연동, 플러그인 시스템, 태그·와일드카드 기능까지 포함한다. 별도 프로젝트인 ‘SugarSubstitute(Qt 기반 네이티브 프론트엔드)’도 같은 시기에 개발 중임이 알려지며 ComfyUI 대체 UI 경쟁이 가열되는 양상이다. 현장 관점에선 노드 학습 비용 없이 팀원을 빠르게 온보딩해야 하는 소규모 제작사에 당장 시험해볼 만한 선택지가 생겼다.

🔗 원문 보기 — EasyUI – built over many months, late nights, and real dedication. Now 100% open-source.

7. Runway Big Pitch 공모전 출품작 ‘Underhill Trailer’ 실전 사례 공개

Reddit 사용자가 Runway의 ‘Big Pitch’ 공모전에 제출한 단편 트레일러 ‘Underhill’을 공개했다. Runway Gen 계열 툴을 활용한 실제 제작물로, 공모전 출품이라는 구체적인 목적 아래 제작된 영상이라는 점에서 단순 테스트물과 차별된다. Runway Big Pitch는 AI 영상 제작자를 대상으로 한 공식 공모전으로, 우승작은 Runway 측의 공식 채널을 통해 노출된다. 현장 관점에선 툴 성능 자랑보다 ‘실제 공모전 제출용 퀄리티가 어느 수준인가’를 가늠할 수 있는 현실적인 레퍼런스라는 데 의미가 있다.

🔗 원문 보기 — Underhill Trailer – My entry in the Runway Big Pitch

8. Reallusion iClone 8 리뷰: 캐릭터 애니메이션 파이프라인 실용성 점검

전문 리뷰 매체에서 Reallusion iClone 8에 대한 심층 리뷰를 게재했다. ‘캐릭터 애니메이션의 골드 스탠다드’라는 평가와 함께 다양한 크리에이티브 워크플로우와의 연동성이 강점으로 꼽혔다. AI 생성 영상이 인물 동작 표현에서 여전히 불안정한 만큼, iClone 8처럼 컨트롤 가능한 캐릭터 애니메이션 도구의 역할이 오히려 부각되는 시점이다. 현장 관점에선 AI 생성과 전통 3D 애니메이션을 혼합하는 하이브리드 파이프라인을 고민 중인 제작사라면, 이 리뷰가 도입 결정에 참고 자료로 쓸 만하다.

🔗 원문 보기 — Reallusion iClone 8 review: the gold standard for easy character animation

9. Qwen-Image·ERNIE·FLUX 2 Dev, RTX 5090 단일 GPU 8스타일 비교

개인 사용자가 RTX 5090 한 장 환경에서 Qwen-Image, ERNIE Base, ERNIE Turbo, FLUX 2 Dev를 동일한 8가지 커스텀 스타일 프롬프트로 테스트한 결과를 공유했다. 오픈소스 이미지 모델 중 프로토타이핑 작업에 어떤 모델을 기본으로 쓸지 결정하기 위한 실용적 비교로, 스타일 재현 일관성과 프롬프트 반응성 차이가 시각적으로 정리됐다. 단일 고사양 GPU 결과물이라 보급형 환경과 격차가 있을 수 있다는 점은 감안해야 한다. 현장 관점에선 광고 시안용 스타일 레퍼런스 이미지를 여러 모델로 빠르게 뽑아볼 때 어느 모델이 가장 ‘말을 잘 듣는지’ 판단하는 데 직접적으로 참고할 수 있는 비교다.

🔗 원문 보기 — Side-by-side comparison of Qwen-Image, ERNIE Base/Turbo, and FLUX.2 Dev across 8 custom styles (single RTX 5090)

10. ACE 1.5 기반 음악 8트랙 동시 생성 워크플로우 ComfyUI에 공개

Civitai에 ACE 1.5 Turbo XL 기반의 ‘Ultimate Music Maker’ ComfyUI 워크플로우가 공개됐다. 가사·키스케일·BPM·재생 시간을 각각 지정해 한 번에 8곡을 동시 생성할 수 있으며, 로컬 실행 기반이라 API 비용 없이 반복 생성이 가능하다. Suno·Udio 같은 유료 서비스를 대체할 수 있는지는 품질 차이가 관건이나, 영상 배경음악 초안을 대량으로 뽑아야 하는 작업에서 비용 절감 효과가 기대된다. 현장 관점에선 MV나 광고 음악 레퍼런스 시안 단계에서 클라이언트 방향성을 잡을 때 유료 서비스 대신 먼저 돌려보는 용도로 충분히 써볼 만하다.

🔗 원문 보기 — Ultimate Music Maker


📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만

댓글 남기기