AI 영상·이미지·생성 도구 분야의 오늘(2026/05/15) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.
1. LTX Director 출시: LTX 2.3 올인원 타임라인 편집기
ComfyUI용 LTX Director가 공개됐다. I2V·T2V·FLFF·프롬프트 릴레이·커스텀 오디오를 하나의 타임라인 인터페이스에서 처리할 수 있으며, 기존 LTX Sequencer와 Multi Image Loader 노드를 통합·진화시킨 버전이다. LTX 2.3의 립싱크 기능(SeeVR2)도 8GB VRAM 환경에서 작동 확인됐다. 별도 립싱크 파이프라인 없이 타임라인 안에서 오디오까지 붙일 수 있다는 건 실제 납품 워크플로우 단축에 직결된다—단, RTX 5060 Ti 16GB 기준으로도 FP8+VFI×2+3X 업스케일 동시 구동 시 RAM 부족이 보고됐으니 메모리 여유분 확인 먼저.

2. ComfyUI에 VOID·BiRefNet·Gemma 4 오픈소스 3종 추가
ComfyUI 공식 노드 생태계에 VOID(텍스트 편집), BiRefNet(이미지 배경 분리), Gemma 4(멀티모달 언어모델) 세 가지 오픈소스 모델이 새로 통합됐다. 특히 BiRefNet은 기존 유료 배경 제거 API를 대체할 수 있는 품질로 알려져 있으며, 로컬 실행 시 API 비용 제로다. Gemma 4 통합으로 프롬프트 자동 생성·설명 파이프라인도 ComfyUI 안에서 처리 가능해졌다. 클라우드 API 비용이 쌓이는 상업 프로젝트라면 BiRefNet 로컬 전환부터 검토해볼 만하다.
🔗 원문 보기 — New Open-Source Models Now in ComfyUI: VOID, BiRefNet & Gemma 4
3. Anima Base v1.0 정식 출시—LoRA 호환성 확인 완료
Circlestone Labs의 영상 생성 모델 Anima Base v1.0이 CivitAI와 HuggingFace에 동시 공개됐다. 커뮤니티 테스트 결과 프리뷰 3(PV3) 시점에 학습된 LoRA를 정식 버전에서 거의 그대로 사용할 수 있으며, 색상 미세 변이 정도의 차이만 확인됐다. 별도 공개된 Anima TrainFlow는 6GB VRAM 환경에서 단일 페이지 UI로 LoRA 학습을 지원한다. PV 단계 자산을 버려야 하는 상황이 아니라는 점은 반갑지만, 정식 출시치고 레퍼런스 문서가 여전히 얇다는 게 현장 관점에선 걸린다.
🔗 원문 보기 — Anima base v1.0 has been released.
4. Chroma1-HD + Flux.2 Dev + Wan 2.2 + LTX 2.3 통합 캐릭터 워크플로우 공개
ComfyUI에서 이미지·영상까지 캐릭터 일관성을 유지하는 엔드투엔드 워크플로우가 커뮤니티에 공유됐다. Chroma1-HD로 고화질 이미지 생성, Flux.2 Dev로 스타일 제어, Wan 2.2와 LTX 2.3으로 영상 출력하며 얼굴·성우 보이스 모두 유지된다고 명시했다. 광고·뮤직비디오에서 반복 등장하는 가상 인물 제작에 바로 적용 가능한 구조다. 단일 툴에 의존하지 않는 멀티모델 체이닝이라 중간 노드 하나 업데이트될 때마다 전체 파이프라인 점검이 필요하다는 유지보수 부담은 감수해야 한다.
🔗 원문 보기 — Character Workflow: Chroma1-HD + Flux.2 Dev + Wan 2.2 + LTX 2.3
5. AsymFLUX.2-klein-9B: 픽셀 공간 텍스트→이미지 신규 모델
Black Forest Labs의 FLUX.2-klein-base-9B를 기반으로 AsymFlow 방식으로 파인튜닝한 픽셀 공간 텍스트→이미지 모델 AsymFLUX.2-klein이 공개됐다. 레이턴트 공간이 아닌 픽셀 공간에서 직접 연산한다는 구조적 차이가 특징이며, 9B 파라미터 규모다. 아직 커뮤니티 실사용 레포트가 적어 실제 품질·속도 비교 데이터는 부족하다. FLUX 계열 모델을 이미 운용 중이라면 기존 LoRA 호환 여부를 먼저 확인한 뒤 테스트 순서에 올려두는 정도가 현실적이다.
🔗 원문 보기 — AsymFLUX.2-klein-9B – Pixel Space Model.
6. LTX 2.3 고사양 워크플로우, RTX 5060 Ti 16GB도 RAM 부족
LTX 2.3 기반 FP8 워크플로우에 VFI×2 인터폴레이션과 RTX VSR 3× 업스케일을 동시에 돌리면 RTX 5060 Ti(16GB VRAM) 환경에서도 시스템 RAM이 쉽게 부족해진다는 실사용 보고가 나왔다. LoRA 미적재 상태에서도 동일 현상이 발생했으며, 작성자는 96GB DDR4 RAM을 확보하지 못한 것을 후회한다고 밝혔다. 현세대 소비자 GPU 기준으로 고품질 영상 풀파이프라인 단일 구동은 여전히 RAM이 병목이라는 현실 확인이다—VRAM 스펙만 보고 장비 투자 결정하다가는 낭패 본다.
🔗 원문 보기 — Wish I had gotten the 96GB DDR4 RAM when I had the chance.
7. Wirestock, AI 학습 데이터 공급사로 전환 후 2300만 달러 조달
크리에이터 포트폴리오 플랫폼으로 출발한 Wirestock이 2023년 AI 학습 데이터 공급사로 피벗, 이미지·영상·디자인 에셋·게임·3D 콘텐츠 데이터셋을 주요 AI 랩에 납품하며 2300만 달러를 추가 조달했다. 한국 크리에이터 관점에서는 자신이 업로드한 콘텐츠가 학습 데이터로 팔리고 있을 가능성을 의미하며, 이미 Wirestock에 올라간 자료의 라이선스 조항을 재확인할 필요가 있다. 동시에 고품질 영상 에셋을 보유한 프로덕션이라면 직접 데이터 라이선싱 수익 루트를 검토해볼 시점이기도 하다.
🔗 원문 보기 — Wirestock raises $23M to supply creative multimodal data to AI labs
8. OpenAI, Apple과 ChatGPT 통합 결과 불만으로 법적 검토 중
OpenAI가 Apple과의 ChatGPT 통합이 기대한 구독자 유입과 노출을 제공하지 못했다며 법적 대응을 검토 중이라고 복수 매체가 보도했다. 계약 파트너간 갈등이 법정으로 번지면 iOS 기반 AI 기능 배포 일정에 불확실성이 생긴다. 한국 모바일 영상 제작 환경에서 iPhone 기반 AI 보조 도구 의존도가 높은 팀이라면 해당 통합 기능의 지속성을 낙관하기 어렵다. 플랫폼 종속 리스크를 줄이려면 특정 디바이스 네이티브 AI 기능보다 API 직접 연동 방식을 병행하는 게 안전하다.
9. 오픈소스 AI 영상 워크플로우용 제로설정 Docker 러너 ‘OpenFork’ 등장
CUDA 충돌·Python 패키지 의존성 오류·커스텀 노드 설정 반복 문제에 지친 개발자가 AI 영상·오디오·이미지 워크플로우를 위한 제로설정 Docker 러너 ‘OpenFork’를 공개했다. 별도 환경 세팅 없이 컨테이너 실행만으로 ComfyUI 기반 워크플로우를 구동하는 것이 목표다. 현재 초기 단계라 지원 노드 범위와 안정성은 검증이 더 필요하다. 팀 단위로 동일 환경을 공유해야 하는 스튜디오라면 지금 당장 프로덕션 투입보다는 개발·테스트 서버 격리 용도로 먼저 써보는 게 현실적이다.
10. 모네 실제 그림을 AI 작품으로 올렸더니 ‘AI 티 난다’는 혹평 쏟아진 실험
소셜미디어에서 한 사용자가 모네의 실제 회화를 AI 생성 이미지라고 속여 올리고 ‘이 AI 이미지의 문제점을 지적해달라’고 요청한 결과, 다수가 AI 특유의 결함이라며 구체적 비판을 쏟아냈다. 이 실험은 현재 AI 이미지 판별 기준이 얼마나 주관적이고 오류 가능성이 높은지를 드러낸다. 한국 광고·콘텐츠 시장에서 ‘AI 느낌 난다’는 클라이언트 피드백을 무작정 수용하기 전에, 판단 기준 자체를 점검해볼 필요가 있다는 실질적 레퍼런스가 생겼다.
🔗 원문 보기 — Someone Shared a Real Monet Painting as AI and Asked for Critiques
📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!
매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만