오늘의 AI 뉴스 — 2026/05/08 (금)

AI 영상·이미지·생성 도구 분야의 오늘(2026/05/08) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. LTX 2.3 v1.1 Distilled, RTX 4060 Ti 16GB로 TikTok 숏폼 실전 테스트

Reddit 사용자가 RTX 4060 Ti 16GB VRAM + 64GB RAM 환경에서 LTX 2.3 v1.1 Distilled 버전을 ComfyUI로 구동해 UGC·TikTok 브이로그 스타일 영상을 생성하는 데 ‘충분히 쓸 만하다’는 결과를 공유했다. 핵심 변수는 PyTorch 버전을 2.11.0 + CUDA 13으로 올리는 것이며, CUDA 12 환경 대비 속도가 체감상 유의미하게 빨라진다고 밝혔다. 국내 크리에이터 기준으로 4060 Ti 16GB는 100만 원대 중반 GPU라 진입 장벽이 낮은 편이고, 숏폼 UGC 특성상 품질 허들도 낮아 실제 납품 파이프라인 테스트에 써볼 만한 조합이다. 현장 관점에선 ‘클라이언트 시안용 목업 영상’처럼 퀄리티보다 속도가 우선인 작업에 먼저 끼워 넣어 보는 게 현실적인 도입 경로다.

🔗 원문 보기 — testing LTX 2.3 v1.1 distilled on my gpu. pretty decent for creating ugc content or short tiktok vlog.

2. ComfyUI ‘Lighthouse’ 모드: 노드 의존성 거리 시각화로 워크플로 디버깅 혁신

ComfyUI 커스텀 노드 개발자가 이틀 만에 만든 ‘Lighthouse’ 모드를 공개했다. 특정 노드를 클릭하면 그래프 거리 기준으로 직접 의존 노드는 빨간색, 이후 단계는 주황·노랑·초록·파랑·보라 순으로 색이 바뀌어 전체 연결 구조를 즉시 파악할 수 있다. 기존 실행 깊이 기준 정렬 도구들이 오히려 흐름을 헷갈리게 만들던 문제를 그래프 거리 방식으로 해결한 접근이다. ComfyUI 워크플로가 10개 노드만 넘어도 스파게티가 되는 건 모두가 아는 현실인데, 이 툴은 ‘CleanFreak(역할별 컬럼 정렬, 1,200개 노드 사전 분류)’ 노드와 함께 쓰면 대형 워크플로 유지보수 시간을 실질적으로 줄여줄 가능성이 높다. 현장 관점에선 납품 후 몇 달 지난 워크플로를 다시 열었을 때 가장 먼저 켜고 싶은 기능이다.

🔗 원문 보기 — ‘Lighthouse’ mode for ComfyUI — click any node and the rest of the workflow lights up by graph distance. Direct dependencies red, then orange, yellow, green, blue, violet.

3. ComfyUI LoRA 검색 노드 ‘FindingLora’: 퍼지 검색·북마크·트리거 원클릭 체이닝

수백 개 이상의 LoRA를 운용하는 ComfyUI 사용자가 자체 제작한 커스텀 노드 ‘comfyui-lora-FindingLora’를 오픈소스로 공개했다. 기존 기본 LoRA 로더의 거대한 드롭다운 대신 퍼지(fuzzy) 검색, 북마크, 트리거 워드 자동 삽입, 원클릭 체이닝을 지원한다. 특히 LoRA를 순차적으로 쌓아야 하는 스타일·캐릭터 합성 작업에서 클릭 수를 대폭 줄여주는 점이 포인트다. LoRA가 50개만 넘어도 관리가 지옥이 된다는 건 이미 알고 있을 테고, 현장 관점에선 광고 캠페인별로 브랜드 스타일 LoRA를 전환해야 하는 상황에서 이 노드가 실수 방지 역할까지 해줄 수 있다.

🔗 원문 보기 — comfyui-lora-FindingLora – a Lora Loader with fuzzy search, one click chaining, bookmarks and triggers.

4. Blender 안에서 ComfyUI 돌리는 ‘Riel Studio’ 플러그인 개발 중

한 개발자가 Blender 내부에서 ComfyUI를 직접 실행할 수 있는 ‘Riel Studio’ 플러그인을 개발 중(WIP)이라고 공개했다. 3D 애니메이션 파이프라인과 AI 이미지·영상 생성을 단일 인터페이스에서 처리하려는 시도로, 현재는 작업 진행 중 단계다. 완성되면 Blender에서 렌더링한 3D 장면을 즉시 ComfyUI 노드로 넘겨 스타일라이징하거나 영상 생성 조건으로 쓰는 흐름이 가능해진다. 현장 관점에선 3D 시각화 기반 광고 제작사라면 정식 릴리스 시점을 눈여겨봐야 할 프로젝트이지만, WIP 단계에서 프로덕션 파이프라인에 끼워 넣는 건 아직 무리다.

🔗 원문 보기 — Riel Studio — ComfyUI inside Blender (Working in progress)

5. Juggernaut Z 출시: Z-Image 베이스 파인튜닝, SDXL 후계자 자처

SDXL 시절 가장 많이 쓰이던 파인튜닝 모델 Juggernaut의 신작 ‘Juggernaut Z’가 Z-Image 베이스 모델 기반으로 출시됐다. 개발팀은 Z-Image 아키텍처 위에서 인물·광고 이미지 품질을 SDXL 시절 Juggernaut 수준 이상으로 끌어올리는 것을 목표로 하고 있으며, 추가 버전 개발도 예고했다. SDXL 기반 상업 이미지 파이프라인을 여전히 운용 중인 스튜디오라면 Z-Image로의 마이그레이션 시 Juggernaut Z가 가장 빠른 전환 경로가 될 수 있다. 현장 관점에선 기존 Juggernaut LoRA 자산이 얼마나 호환되는지가 실제 도입 결정의 핵심 변수가 될 것이다.

🔗 원문 보기 — Juggernaut Z

6. 단일 이미지로 스타일 LoRA 학습: 뎁스맵 컨디셔닝 기법 공개 및 커뮤니티 무료 훈련

한 개발자가 단 한 장의 이미지에서 스타일 LoRA를 추출하는 기법을 개발해 공개했다. 핵심은 뎁스맵(depth map)을 컨디셔닝 신호로 활용하는 것으로, 원래는 캐릭터 유사도 향상이 목표였지만 스타일 전이에도 유효하게 작동했다고 밝혔다. 현재 Klein 9b 모델 기준으로 커뮤니티 이미지를 무료로 훈련해주겠다고 제안하고 있어 실험 참여가 가능하다. 광고·뮤직비디오에서 특정 아트디렉션을 일관되게 유지해야 할 때 레퍼런스 한 장으로 LoRA를 뽑을 수 있다면 실무 효율이 크게 올라가는데, 현장 관점에선 재현성과 스타일 범위 한계를 먼저 검증하고 클라이언트 작업에 적용해야 한다.

🔗 원문 보기 — Working on a technique to produce style LoRAs from a single image. Post yours and I’ll train it for Klein 9b!

7. Banodoco Hivemind 오픈소스 공개: 3년치 AI 영상·이미지 제작자 Discord 100만+ 메시지 데이터셋

Banodoco가 지난 3년간 오픈 이미지·영상 모델을 실제로 사용한 아티스트·엔지니어들의 Discord 메시지 100만 건 이상을 에이전트 스킬 패키지 형태로 오픈소스 공개했다. 단순 로그 덤프가 아니라 현장 실무자들의 프롬프트 전략, 오류 해결 패턴, 워크플로 논의가 집약된 데이터라는 점이 차별점이다. ComfyUI 기반 파이프라인을 구축하는 팀이라면 이 데이터셋을 RAG나 파인튜닝 소스로 활용해 사내 AI 어시스턴트를 만드는 시나리오가 현실적이다. 현장 관점에선 ‘어떻게 쓰는지’보다 ‘왜 안 되는지’를 빠르게 찾아주는 검색 도구로 먼저 써보는 게 가장 빠른 활용법이다.

🔗 원문 보기 — Open-sourcing Banodoco Hivemind: 1M+ Discord messages from artists and engineers working deeply with open image/video models, packaged as an agent skill

8. Maxon Autograph, 팀·엔터프라이즈까지 무료 상업 이용 전면 개방

모션그래픽·VFX 소프트웨어 기업 Maxon이 개인 무료 제공에 이어 Autograph의 팀·엔터프라이즈 플랜까지 무료 상업 이용으로 확대했다. Autograph는 After Effects 대안으로 포지셔닝된 모션그래픽 툴로, GPU 가속 렌더링과 노드 기반 컴포지팅을 특징으로 한다. 라이선스 비용 없이 팀 단위 도입이 가능해진 만큼, 어도비 구독 비용을 줄이려는 소규모 프로덕션 하우스에는 실질적인 대안이 될 수 있다. 현장 관점에선 After Effects 플러그인 생태계 호환성과 한국어 지원 수준을 먼저 확인해야 도입 결정이 가능하다.

🔗 원문 보기 — Maxon Makes Autograph Free For All Users

9. OpenAI API 신규 실시간 음성 모델: 추론·번역·STT 통합, 영상 후반작업 활용 가능성

OpenAI가 API를 통해 새로운 실시간 음성 모델을 출시했다. 기존 Whisper 계열과 달리 단순 전사(STT)를 넘어 음성 기반 추론과 다국어 번역까지 단일 API 호출로 처리할 수 있다고 밝혔다. 영상 제작 파이프라인 관점에서는 다국어 콘텐츠의 자막 생성·번역·더빙 스크립트 추출을 자동화하는 데 실용적으로 연결할 수 있는 구조다. 현장 관점에선 한국어-영어 번역 정확도와 지연 시간(latency) 수치가 공개되지 않은 상태라 실제 납품용 자막 워크플로에 적용하기 전에 직접 벤치마크를 돌려봐야 한다.

🔗 원문 보기 — OpenAI launches new voice intelligence features in its API

10. Suno v5.5, 악보 텍스트 입력으로 멜로디 제어 가능성 실험 결과 공유

Reddit 사용자가 Suno v5.5에서 ‘Greensleeves’, ‘Ave Maria’, ‘Frère Jacques’ 등 클래식 멜로디를 텍스트 형태로 입력해 음악 생성에 부분적으로 반영시키는 방법을 발견했다. 완전한 악보 입력은 아니지만, 구조화된 멜로디 힌트를 프롬프트에 포함하면 기존 무작위 생성보다 의도한 멜로디 윤곽이 결과물에 나타나는 경향이 확인됐다. 뮤직비디오나 광고 영상에서 특정 멜로디 라인이 요구되는 경우 레퍼런스 멜로디 텍스트를 프롬프트에 구조화해 넣는 실험이 의미 있는 단계에 왔다. 현장 관점에선 아직 재현성이 불안정한 ‘꼼수’ 수준이라 클라이언트 납품보다는 레퍼런스 시안 생성 단계에 한정해 쓰는 것이 현실적이다.

🔗 원문 보기 — Brutal GREENSLEEVES, AVE MARIA and FRÈRE JACQUES (Suno v5.5)

📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만