AI 영상·이미지·생성 도구 분야의 오늘(2026/05/11) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.
1. LTX 2.3 비디오 추론 LoRA, 물리 기반 모션 구현 가능
ComfyUI용 LTX 2.3 Video Reasoning LoRA 워크플로우가 공개됐다. 이 커스텀 워크플로우는 실세계 물리 법칙을 모델이 이해하도록 유도해 기존 LTX 2.3 대비 모션 리얼리티를 끌어올린다는 평가를 받고 있다. 최근 커뮤니티에서는 WAN 모델 대신 LTX 2.3으로 이동하는 흐름이 뚜렷하게 감지되고 있으며, Civitai 내 WAN 신규 LoRA 업로드가 눈에 띄게 줄고 있다. 다만 LTX 2.3이 월드 어웨어니스 면에서 WAN보다 부족하다는 현장 불만도 공존하는 상태다. 현장 관점에선 툴 전환보다 각 모델의 강점을 파악해 용도별로 분리 운용하는 게 현실적이다.

🔗 원문 보기 — Comfyui Tutorial: LTX 2.3 Video Reasoning LoRA make AI Motion Actually
2. HiDream-O1, 저VRAM 워크플로우 공개 — VAE 없는 픽셀 스페이스 구조
HiDream-O1 이미지 모델의 bf16 버전을 위한 ComfyUI 커스텀 노드와 GGUF 지원 저VRAM 워크플로우가 릴리즈됐다. 눈에 띄는 점은 VAE 없이 픽셀 스페이스에서 직접 동작하는 구조로, 학습 효율이 기존 Flux 계열 대비 높다는 초기 보고가 나오고 있다. OSTRIS가 AI Toolkit에서 LoRA 트레이닝 첫 테스트를 진행 중이며 ‘지금껏 본 모델 중 가장 흥미롭다’고 언급했다. 다만 Artificial Analysis 벤치마크 결과에 대해 커뮤니티 일부가 신뢰성 문제를 제기하고 있어, 수치를 액면 그대로 믿기엔 이르다. 현장 관점에선 저VRAM 환경에서 쓸 만한 고품질 이미지 모델 후보로 주목할 가치는 있으나, LoRA 생태계가 갖춰지기까지 최소 수주는 더 지켜봐야 한다.
🔗 원문 보기 — HiDream-01-Image Dev + Base | LOW VRAM Workflow
3. Flux.2 Klein 9B용 스킨 개선 LoRA 2종 공개 — 리얼리즘 제작자 주목
Flux.2 Klein 9B 모델의 피부 표현 약점을 보완하는 LoRA 두 가지가 Civitai에 잇따라 공개됐다. 하나는 ‘Better Skin v1’으로 포토리얼리스틱 스타일 인물의 피부 텍스처를 개선하는 용도이고, 다른 하나는 ‘Flux Identity Adjustor Node’로 인물 동일성 유지에 특화됐다. AI 생성 이미지에서 피부 표현이 과도하게 매끄럽게 나오는 원인은 학습 데이터 내 리터치 편향 때문으로 분석되며, 이 문제는 Flux 계열 전반에 걸친 구조적 이슈다. 현장 관점에선 광고용 인물 소재를 Flux로 뽑을 때 이 LoRA들을 기본 스택에 넣어두면 후보정 시간을 줄일 수 있다.
🔗 원문 보기 — Releasing -Better Skin v1 – LoRA for FLUX.2 Klein Base 9B
4. ComfyUI 클라우드 GPU 원커맨드 설치 툴 오픈소스 공개
클라우드 GPU를 렌트할 때마다 ComfyUI를 처음부터 재설치해야 하는 번거로움을 해결하는 오픈소스 툴이 공개됐다. 커스텀 노드·모델·설정을 세션 간에 유지해주며 단일 커맨드로 어떤 클라우드 GPU에도 설치된다. 기존 Docker 이미지보다 유연하다는 평가이며, GPU 렌트 비용은 그대로지만 세션당 45분가량의 셋업 시간을 제거하는 것이 핵심 가치다. 로컬 머신 VRAM이 부족해 클라우드를 간헐적으로 쓰는 국내 1인 제작자나 소규모 스튜디오에 실질적으로 유용하다. 현장 관점에선 RunPod·Vast.ai 조합으로 쓸 때 특히 효과적이며, 오픈소스라 커스터마이징 여지도 있다.
5. LTX 2.3 무료 무제한 AI 영상 생성 사이트 loremotion.com 오픈
개인 개발자가 자체 GPU에 LTX 2.3을 올려 크레딧·구독·용량 제한 없이 AI 영상을 생성할 수 있는 loremotion.com을 공개했다. 상용 서비스와 달리 별도 결제 없이 사용 가능하며, 서버 비용은 운영자가 자체 부담하는 구조다. 다만 개인 운영이라 서버 안정성·지속 가능성은 불확실하고, LTX 2.3 자체의 월드 어웨어니스 한계는 그대로 따라온다. 빠른 프로토타입 테스트나 클라이언트 설득용 러프 시안 제작에는 써볼 만한 옵션이다. 현장 관점에선 ‘무료 무제한’이라는 말은 운영자가 버틸 때까지만 유효하니, 중요한 프로젝트 납기에 의존하는 건 금물이다.
🔗 원문 보기 — I built a site to create free AI videos using LTX 2.3 running on my own GPUs
6. Ace-Step 1.5용 슬라이더 LoRA 공개 — 음악 생성 파라미터 세부 제어
AI 뮤직 생성 모델 Ace-Step 1.5를 위한 슬라이더 LoRA가 Hugging Face에 공개됐다. AI Toolkit이 Ace-Step 1.5 슬라이더 LoRA를 공식 지원하지 않아 개발자가 코드를 직접 수정해 구현했으며, 특정 음악적 속성을 강도 조절해 컨트롤할 수 있다. 뮤직비디오·광고 사운드트랙을 AI로 제작하는 워크플로우에서 사운드 방향성을 세밀하게 조정하려는 수요에 답하는 작업이다. 공식 지원이 아닌 코드 수정 방식이라 툴킷 업데이트 시 호환성 문제가 생길 수 있다는 점은 감수해야 한다. 현장 관점에선 브랜드 사운드 정체성이 중요한 광고 음악 작업에서 반복 시도 횟수를 줄여주는 실용적 도구다.
🔗 원문 보기 — I made some Slider Loras for Ace-Step 1.5 if anyone is interested
7. 상업 사진가가 말하는 AI 사용 기준 — 실전 판단 기준 정리
현직 상업 사진가가 클라이언트 룩북 의뢰를 AI로 처리한 경험을 바탕으로 AI를 쓸 때와 쓰지 말아야 할 때를 구체적으로 정리한 글이 올라왔다. 핵심 논지는 AI가 모델·스튜디오 비용을 줄이는 데는 쓸 수 있지만, 패브릭 질감·핏·실제 착용감 표현에서 한계가 명확하고 클라이언트 기대치 관리가 더 어려워질 수 있다는 것이다. 국내 패션·뷰티 광고 시장에서도 AI 소재 활용 요청이 늘고 있지만, 최종 책임은 여전히 제작자에게 돌아오는 구조다. 현장 관점에선 AI를 쓰겠다고 결정하기 전에 ‘이 장면에서 실패했을 때 누가 재촬영 비용을 부담하는가’를 먼저 계약서에 못 박아야 한다.
🔗 원문 보기 — A Commercial Photographer’s Take on When to Use AI (and When Not To)
8. Diffusion 파인튜닝 하이퍼파라미터 탐색 자동화 오픈소스 툴 공개
LoRA 트레이닝 시 학습률·스텝 수 등 하이퍼파라미터를 매번 수동으로 바꿔 비교하던 반복 작업을 자동화하는 오픈소스 툴이 공개됐다. 여러 파라미터 조합을 한 번에 돌리고 샘플 결과를 점수 기반으로 비교해 최적 설정을 고를 수 있는 구조다. LoRA를 자체 제작해 광고·뮤직비디오 특정 스타일을 고정하려는 소규모 스튜디오나 1인 제작자에게 실질적으로 유용하다. 새 데이터셋마다 파라미터를 처음부터 탐색해야 했던 비효율을 줄여준다는 점이 핵심이다. 현장 관점에선 GPU 렌트 비용을 쓰면서 ‘감으로 돌리는’ 시대는 이 툴로 끝낼 수 있다.
9. AI 음악 주간 동향 — AI 라벨링 의무화 흐름 본격화
2026년 5월 11일자 AI 뮤직 위클리 뉴스에 따르면, AI 생성 음악에 대한 라벨링 의무화 논의가 업계 주요 이슈로 부상하고 있다. Suno v5.5 등 최신 모델 기반 생성물이 배포되는 상황에서, 플랫폼 측의 AI 식별 태그 부착 요구가 강해지고 있는 추세다. 국내에서도 광고 음악·뮤직비디오 배경음악에 AI 생성 사운드를 사용하는 경우가 늘고 있는 만큼, 납품처별 AI 콘텐츠 정책을 미리 확인해야 하는 상황이 됐다. 특히 방송사·OTT 플랫폼 납품 시 AI 생성 음원 사용 여부를 계약서 단계에서 명시하는 관행이 자리잡기 시작했다. 현장 관점에선 ‘몰래 쓰다 걸리는’ 리스크가 점점 현실화되고 있으니, 사용 여부를 투명하게 관리하는 내부 기준을 지금 만들어두는 게 낫다.
🔗 원문 보기 — AI Music Weekly News | 20260511
10. Google Veo + Suno 조합 뮤직비디오 제작 사례 공유
Reddit 사용자가 Google Veo와 Suno를 조합해 뮤직비디오를 제작한 사례를 공유했다. Veo로 영상 소재를 생성하고 Suno로 음악을 만든 뒤 편집으로 합친 파이프라인으로, 별도 촬영 없이 완결된 뮤직비디오 형태를 구성했다. Veo는 현재 Google Labs를 통해 제한적으로 접근 가능하며, 국내 사용자의 경우 접근성 제약이 여전히 존재한다. Suno는 한국어 가사 처리 품질이 개선되고 있으나 발음 자연스러움은 아직 일본어·영어 대비 낮다는 현장 피드백이 지속된다. 현장 관점에선 Veo 접근권이 없는 국내 제작자라면 Kling이나 Hailuo와 Suno를 묶는 대안 파이프라인이 현실적으로 더 빠른 선택이다.
🔗 원문 보기 — I create a music video using gen ai tools google veo , suno
📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!
매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만