오늘의 AI 뉴스 — 2026/06/07 (일)

AI 영상·이미지·생성 도구 분야의 오늘(2026/06/07) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. Ideogram 4, ComfyUI에서 LoRA 지원·워크플로 공개

Ideogram 4가 ComfyUI에 통합되면서 LoRA 학습 및 적용 워크플로가 실사용 가능한 수준으로 정리됐다. AIToolkit 디스코드 커뮤니티 협업으로 며칠 만에 안정화됐으며, 기존 IP(캐릭터·브랜드) 테스트 결과 포토리얼리즘과 다양한 아트 스타일에서 준수한 퀄리티를 보였다. 단, ComfyUI 내에서는 생성 속도가 느리고 안전 필터가 무작위로 걸리는 문제가 보고됐다. Qwen3-VL 8B(언센서드 버전)로 이미지를 분석해 JSON 프롬프트를 자동 생성한 뒤 Ideogram 4에 넣는 로컬 파이프라인도 공유됐다. 현장 관점에선 광고 시안·포스터 레이아웃 시안 작업에 바로 투입해볼 만하지만, API 비용과 생성 속도는 실무 납기와 맞는지 먼저 확인해야 한다.

어두운 배경 위 차갑고 푸른 빛을 발산하는 광섬유 케이블 다발의 극단적인 클로즈업 매크로 샷

🔗 원문 보기 — Workflow: Ideogram4 with LoRA support, fixes

2. Seedance로 만든 AI 애니 실사 예시 공개, 실용성 점검

Seedance 영상 생성 툴로 제작한 애니메이션 시리즈 ‘Crazy Rari 에피소드 3’가 Reddit에 공유되며 실제 결과물 품질이 공개됐다. 짧은 숏폼 애니메이션 형식으로, 일관된 캐릭터 유지와 움직임 자연스러움이 주요 평가 포인트다. Seedance는 ByteDance 계열 서비스로 현재 API 접근이 제한적이며 한국 내 직접 과금 구조가 불명확하다. 뮤직비디오·숏폼 콘텐츠 제작사 입장에서는 Kling·Runway와 비교해 스타일 일관성 면에서 어느 위치인지 직접 테스트가 필요하다. 현장 관점에선 결과물 자체보다 ‘반복 생성 시 캐릭터 일관성이 얼마나 유지되는가’가 실무 투입 기준이 될 것이다.

🔗 원문 보기 — AI Anime made with Seedance | Crazy Rari Episode 3

3. Bernini, WanAnimate 대체재로 부상…240×480 저해상도가 발목

Bernini가 WanAnimate보다 R+V2V(레퍼런스+비디오-투-비디오) 작업에서 소폭 우수하다는 현장 평가가 나왔다. GGUF 포맷 워크플로가 공개됐으며 ComfyUI에서 바로 구동 가능하다. 단, 현재 예시 해상도가 240×480으로 실무 납품 규격에 한참 못 미친다. 업스케일 후처리를 거쳐야 쓸 수 있는 수준이며, SeedVR2 같은 업스케일러와 파이프라인 연결이 필수다. 현장 관점에선 ‘조금 더 낫다’는 체감이 로컬 추론 비용과 후처리 시간을 정당화할 만한지는 직접 워크플로를 돌려봐야 판단 가능하다.

🔗 원문 보기 — Bernini – a better WanAnimate?

4. LTX 2.3, ComfyUI 0.24 업데이트 후 모델 재로딩·OOM 이슈 확산

ComfyUI v0.24.1 업데이트 이후 LTX 2.3 사용자들 사이에서 두 가지 버그가 동시에 보고됐다. 첫째, 이전에는 모델을 한 번만 로드하면 됐는데 업데이트 후 매 실행마다 전체 재로딩이 발생해 대기 시간이 크게 늘었다. 둘째, Flux fp8 + LoRA 2개 조합 워크플로에서 torch.OutOfMemoryError가 새로 발생하고 있다. 10초→15초(240→360프레임) 확장 시 최종 패스 이후 영상이 깨지는 현상도 별도로 확인됐다. 현장 관점에선 납기가 있는 프로젝트라면 당분간 v0.24 이전 버전을 유지하거나, 업데이트 전 환경을 스냅샷으로 백업해두는 것이 현실적인 대응이다.

🔗 원문 보기 — LTX fully reloads the model each time I run it with a recent update – previously it did not do this

5. 커스텀 CNN 업스케일 모델 오픈소스 공개, GitHub서 바로 사용 가능

GitHub 계정 limitlesslab이 직접 학습한 CNN 기반 업스케일 모델 여러 종을 오픈소스로 공개했다. 다양한 아키텍처를 지원하며 ComfyUI에 바로 연동 가능한 형태로 제공된다. Real-ESRGAN·SeedVR2 등 기존 업스케일러 대비 특정 영상 스타일에서 결과 차이가 있다는 커뮤니티 피드백이 초기 공유됐다. 무료·로컬 실행이 가능해 클라우드 API 비용 없이 영상 후처리에 투입할 수 있다. 현장 관점에선 모델별 특성(필름 그레인, 애니메이션, 실사 등)을 파악한 뒤 프로젝트 성격에 맞는 모델을 고르는 테스트가 선행돼야 실제 납품 퀄리티에 기여한다.

🔗 원문 보기 — Sharing my upscale models

6. RTX 5060 Ti 16GB로 LTX 2.3 로컬 영상 생성, 현실적 성능은?

RTX 5060 Ti 16GB VRAM 환경에서 LTX 2.3 이미지-투-비디오 로컬 생성을 시도한 사례가 공유됐다. 아직 구체적인 생성 시간 수치는 확정 공유가 없으나, 커뮤니티에서는 16GB VRAM이 LTX 2.3의 실용 최저 사양으로 통용된다. 5060 Ti는 5080(16GB)보다 메모리 대역폭이 낮아 동일 VRAM이라도 실질 처리 속도 차이가 발생한다. RTX Spark·DGX 같은 신규 하드웨어로의 업그레이드를 고민하는 사용자가 늘고 있지만, 가격 대비 효용은 아직 불명확하다. 현장 관점에선 5060 Ti 16GB는 ‘테스트용 로컬 환경’으로는 수용 가능하나 반복 납품 작업엔 클라우드 병행이 현실적이다.

🔗 원문 보기 — RTX 5060 TI 16 VRAM LTX 2.3 Performance ?

7. OpenAI, 프롬프트 인젝션 차단 ‘Lockdown Mode’ 발표

OpenAI가 ChatGPT에 ‘Lockdown Mode’를 도입했다. 민감한 데이터가 프롬프트 인젝션 공격을 통해 외부로 유출되는 것을 줄이기 위한 보안 기능이다. OpenAI 측은 완전한 차단이 아닌 ‘가능성 감소’라고 명시했으며, 여전히 취약점이 존재할 수 있다고 인정했다. 광고·기업 콘텐츠 제작 시 ChatGPT에 클라이언트 브리프나 미공개 캠페인 정보를 넣는 경우가 많은데, 이 기능은 해당 데이터 보호에 직접적인 관련이 있다. 현장 관점에선 Lockdown Mode 활성화 여부와 실제 데이터 격리 범위를 확인한 뒤 클라이언트 기밀 자료 입력 여부를 결정해야 한다.

🔗 원문 보기 — OpenAI unveils Lockdown Mode to protect sensitive data from prompt injection attacks

8. Warner Music Group, AI 음악 라이선스 방향 LA 컨퍼런스서 힌트 공개

6월 3일 UBS 주최 ‘AI in Entertainment’ 서밋에서 Warner Music Group(WMG)이 AI와의 협업 방향을 시사했다. 구체적 수치나 계약 공개는 없었지만, 영상·게임·음악 분야 AI 활용을 기정사실로 받아들이는 분위기가 확인됐다. 뮤직비디오 및 콘텐츠 제작사 입장에서는 AI 생성 음악의 라이선스 불확실성이 여전히 가장 큰 리스크다. Suno 학습 데이터 무단 사용 논란이 동시에 커뮤니티에서 재부상하고 있어, AI 음악 사용 시 법적 리스크가 커지는 흐름이다. 현장 관점에선 클라이언트 납품물에 AI 음악을 사용할 경우 라이선스 조항을 계약서에 명시하는 것이 이제 선택이 아니라 필수다.

🔗 원문 보기 — Warner Music Group (WMG) drops big hints at conference in L.A.

9. AI 음성 채널 유튜브 수익화 가능…Reddit 괴담은 과장

AI 보이스오버를 사용한 유튜브 채널이 실제로 수익화(애드센스 승인)가 된다는 실사용 경험이 공유됐다. 수개월 전 Reddit에서 ‘AI 음성 채널은 모두 수익화 불가’라는 정보가 광범위하게 퍼졌으나, 실제로는 콘텐츠 품질과 반복성 여부가 기준이지 AI 음성 자체가 차단 사유는 아닌 것으로 확인됐다. 다만 유튜브 정책은 수시로 변경되며, 한국어 AI 보이스 콘텐츠의 경우 검수 기준이 다를 수 있다. 숏폼·교육 콘텐츠 대량 제작 파이프라인을 고민 중인 제작사에는 직접적인 참고 사례다. 현장 관점에선 ‘AI 음성이라서 안 된다’는 공포보다 콘텐츠 반복성(reused content) 정책 위반 여부를 먼저 점검하는 게 현실적이다.

🔗 원문 보기 — People really had me believing AI voice channels don’t get monetized 😭

10. 멀티턴 이미지 편집 강화학습 모델 ‘Edit-R2’ 논문 공개

텍스트 기반 멀티턴 이미지 편집을 강화학습으로 개선한 Edit-R2 논문이 arXiv에 공개됐다(arXiv:2606.05950). 기존 디퓨전 모델 편집 방식이 단일 턴 지시에 최적화된 반면, Edit-R2는 이전 편집 맥락을 반영해 연속 수정 명령에 일관성 있게 대응하는 구조다. 광고 시안 반복 수정, 뮤직비디오 콘셉트 이미지 이터레이션처럼 ‘클라이언트 피드백→재수정’ 루프가 많은 작업에 직접 적용 가능성이 있다. 현재는 논문 단계로 즉시 사용 가능한 툴은 아니며, ComfyUI 등에 구현되기까지 수개월이 걸릴 수 있다. 현장 관점에선 멀티턴 편집 정확도가 올라오면 ‘시안 10번 수정’의 반복 노동을 실질적으로 줄일 수 있는 기술이라 주시할 가치가 있다.

🔗 원문 보기 — Edit-R2: Context-Aware Reinforcement Learning for Multi-Turn Image Editing


📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만

댓글 남기기