AI 영상·이미지·생성 도구 분야의 오늘(2026/05/17) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.
1. LTX 2.3, RTX 3060에서 Sage Attention으로 30% 속도 향상
ComfyUI에서 LTX 2.3 워크플로에 Sage Attention + GGUF 조합을 적용했더니 RTX 3060(6GB VRAM) 기준 생성 속도가 약 30% 빨라졌다는 실사용 보고가 올라왔다. 전환 지원과 오디오 관련 버그 수정도 함께 포함됐으며, 별도 하드웨어 업그레이드 없이 소프트웨어 설정만으로 체감 가능한 수준이다. LTX 2.3 Style Enhancer LoRA를 함께 쓰면 1920×1080 해상도에서 VRAM 6GB로 1회 생성에 약 20분이 소요된다는 튜토리얼도 함께 공유됐다. 현장 관점에선 저사양 장비를 쓰는 1인 제작자라면 GGUF 전환 + Sage Attention 세팅을 먼저 테스트해볼 만한 실질적인 업그레이드다.

🔗 원문 보기 — LTX 2.3 Got 30% Faster on My RTX 3060 (Sage Attention GGUF)
2. FLUX 2 모델, NVLink 없이 두 GPU 네트워크 분산 처리 가능해졌다
개인 개발자가 NVENC 인코더 브릿지를 직접 제작해 FLUX 2 Dev와 Kling 9B 모델 레이어를 이더넷 LAN으로 두 GPU에 분산 처리하는 방법을 공개했다. RTX 5090 + 노트북 RTX 4090 조합으로 이미지 1장당 약 4.4초가 측정됐으며, NVLink 없이 단일 PC 내 멀티 GPU 및 Wi-Fi 6 환경에서도 작동한다고 밝혔다. 레이어 분산 방식이라 두 기기의 VRAM을 합산해 대형 모델 구동이 가능한 구조다. 현장 관점에선 고사양 단일 워크스테이션 구축 예산이 없는 소규모 스튜디오가 유휴 노트북을 연산 노드로 재활용할 수 있는 현실적인 방법이지만, 아직 초기 버전이라 안정성 검증이 필요하다.
3. Seedance 2.0으로 타임프리즈 영화 효과 재현, ComfyUI 워크플로 공개
Seedance 2.0과 ComfyUI를 조합해 퀵실버·잭 스나이더식 타임프리즈 효과를 구현한 워크플로가 GitHub에 공개됐다. 제작자가 40회 이상 실패 후 완성한 결과물로, 워크플로 파일은 SamurAIGPT의 muapi-comfyui 레포지토리에서 무료로 받을 수 있다. 같은 Seedance 2.0으로 구형 SDXL LoRA + NB 조합으로 2000년대 애니 스타일 영상을 만든 결과물도 함께 커뮤니티에 올라오며, 스타일 재현 성능이 검증되고 있다. 현장 관점에선 뮤직비디오나 광고 인서트용 슬로모션 효과를 별도 촬영 없이 후처리로 만들어야 하는 상황에서 실용성을 먼저 확인해볼 만한 워크플로다.
🔗 원문 보기 — Cinematic time freeze effect Seedance 2.0 comfyui workflow
4. INSTARAW 2.0, AI 감지 우회 포함 14종 ComfyUI 워크플로 패키지 무료 공개
HuggingFace에 INSTARAW 2.0 워크플로 커스텀 팩이 공개됐다. 최대 포토리얼 이미지 생성, AI 감지기 우회, RAW 필름 시뮬레이션 등을 포함한 ComfyUI 전용 워크플로 14종을 묶은 패키지로 무료 배포 중이다. AI 감지 우회 기능이 포함된 점은 광고·상업 납품용 이미지를 제작하는 현장에서 민감하게 받아들일 수 있는 요소다. 현장 관점에선 포토리얼 스틸 컷이 필요한 제품 광고나 아트디렉션 시안 작업에 당장 써볼 수 있는 수준이지만, AI 감지 우회 항목은 클라이언트 계약 조건과 충돌할 소지가 있으니 사용 전 확인이 필수다.
🔗 원문 보기 — INSTARAW 2.0 ALL WORKFLOWS RELEASE
5. AsymFlux.2 Klein 9B, 저VRAM 환경 대응 업그레이드 버전 공개
Flux Klein 9B 기반의 AsymFlux.2 Klein 9B가 새 버전으로 공개됐다. 픽셀 스페이스 플로우 모델 구조로 고사실감 이미지와 풍부한 비주얼 스타일 구현을 목표로 하며, 저VRAM 환경을 위한 ComfyUI 워크플로도 함께 제공된다. Klein 9B 계열은 기존 FLUX Dev 대비 모델 크기가 작아 VRAM 8~12GB 수준 장비에서도 운용 가능한 것이 특징이다. 현장 관점에선 풀 FLUX Dev를 돌리기 버거운 장비를 쓰는 제작자라면 Klein 9B 기반 워크플로로 이동하는 것이 현실적인 선택지가 되어가고 있다.
🔗 원문 보기 — AsymFlux.2 Klein 9B | Low Vram Workflow
6. Draw Things + LTX 2.3으로 2000년대 토크쇼 영상 제작, 오디오까지 생성
Draw Things 앱과 LTX 2.3을 조합해 2000년대 스타일 가짜 토크쇼 영상을 제작한 실험 결과가 공유됐다. 핵심은 LTX 2.3의 오디오 생성 기능을 활용해 영상과 음성을 동시에 생성했다는 점이며, 코믹 타이밍까지 어느 정도 구현됐다는 평가다. LTX 2.3이 단순 영상 생성을 넘어 오디오 싱크까지 처리할 수 있다는 점이 재확인됐다. 현장 관점에선 아직 립싱크 정확도가 납품 수준에 도달했다고 보기는 어렵지만, 빠른 시안 제작이나 내부 피칭용 목업 영상에서는 충분히 쓸 만한 단계다.
🔗 원문 보기 — Made a fake 2000s talk show with Draw Things + LTX 2.3
7. Anima(ComfyUI), 디테일 강하지만 다중 캐릭터에선 한계 뚜렷
ComfyUI용 Anima 모델을 실사용한 영상 제작자들의 경험담이 커뮤니티에 쌓이고 있다. Anima Base 1.0 + Qwen Image Edit 2511 + Wan 2.2 조합 워크플로도 공유됐으며, 단일 캐릭터 디테일 표현에서는 높은 만족도가 보고되고 있다. 반면 2인 이상 다중 캐릭터 씬에서는 캐릭터 혼합, 외형 붕괴 등의 문제가 반복적으로 제기되고 있어 현재로선 단독 인물 중심 콘텐츠에 적합하다. 현장 관점에선 인물 비중이 높은 뮤직비디오나 패션 광고 시안 제작에는 쓸 만하지만, 2인 이상 씬이 많은 프로젝트라면 아직 대안 모델과 병행해야 한다.
8. Suno, 다중 보컬 뮤지컬 넘버 생성 시 음색 유지 어렵다는 실사용 보고
브로드웨이 뮤지컬 스타일로 3~4인 다중 보컬 넘버를 Suno로 생성하려는 시도에서, 남성 보컬 음색이 씬 중간에 변하거나 혼선이 생기는 문제가 반복 보고됐다. 현재 Suno는 단일 보컬 혹은 단순 코러스 구조에서는 안정적이지만, 역할별 음색을 구분해 유지하는 다성부 구조에서는 명확한 한계가 있다. Udio 역시 유사한 서비스 불안정 문제로 사용자 이탈이 이어지고 있다는 커뮤니티 반응도 나왔다. 현장 관점에선 뮤직비디오용 다성 보컬 트랙을 AI로 빠르게 시안 제작하려는 경우, 현재는 단성 트랙 여러 개를 후반에 합치는 방식이 현실적인 우회법이다.
🔗 원문 보기 — Suno and multiple cast musical number
9. LoRA 훈련 도구별 결과물 차이, kohya-ss·onetrainer·ai-toolkit 비교 논의
SDXL LoRA 훈련에 쓰이는 kohya-ss, onetrainer, ai-toolkit 간 실제 결과물 품질 차이에 대한 실사용자 비교 논의가 커뮤니티에서 활발하다. 도구 자체보다 캡셔닝 품질, 학습률, 스텝 수 등 하이퍼파라미터 설정이 결과물에 더 큰 영향을 미친다는 의견이 다수지만, ai-toolkit이 FLUX 계열 파인튜닝에서 상대적으로 안정적이라는 평가도 나온다. 캐릭터 시트 + LoRA 기반 일관성 유지 워크플로에 대한 수요도 함께 높아지고 있다. 현장 관점에선 특정 인물이나 제품의 비주얼 아이덴티티를 반복 사용해야 하는 광고 제작자라면 도구 선택보다 훈련 데이터 품질에 먼저 시간을 투자하는 것이 맞다.
🔗 원문 보기 — Training tool impact on resulting LoRAs
10. OpenAI, ChatGPT와 Codex 통합 검토 중…Greg Brockman 제품 전략 총괄
OpenAI 공동창업자 Greg Brockman이 제품 전략 총괄로 복귀하면서, ChatGPT와 코딩 특화 제품 Codex의 통합이 검토되고 있다고 보도됐다. 구체적인 출시 일정이나 영상 생성 관련 기능 변화는 아직 공개되지 않았지만, OpenAI의 내부 조직 재편이 Sora를 포함한 영상 생성 제품 로드맵에도 영향을 줄 가능성이 있다. 최근 OpenAI 내부에서 공급망 공격으로 직원들이 피해를 입은 보안 사고도 동시에 보고됐다. 현장 관점에선 Sora API 접근이나 가격 정책 변화가 뒤따를 수 있으므로, OpenAI 의존도가 높은 제작 파이프라인을 운영 중이라면 대안 툴을 병행 확인해두는 것이 안전하다.
🔗 원문 보기 — OpenAI co-founder Greg Brockman takes charge of product strategy
📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!
매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만