오늘의 AI 뉴스 — 2026/06/08 (월)

AI 영상·이미지·생성 도구 분야의 오늘(2026/06/08) 핵심 뉴스 10건을
한국 영상 제작자 관점으로 정리했습니다.

1. Ideogram 4 오픈소스 로컬 구동: GGUF 출시, 생성 속도는 ZiT 대비 2배 느려

Ideogram 4가 오픈소스로 공개되며 GGUF 포맷까지 배포됐다. 커뮤니티 테스트 기준 fp8 터보 모드에서 2MP 이미지 생성에 약 70초 소요되며, 이는 ZiT(30초) 대비 2배 이상 느린 수치다. 텍스트 렌더링·지시 이행 능력은 업계 최상급으로 평가받고 있으나, 사실적인 인물 사진에서는 ZiT가 더 자연스럽다는 비교 결과도 나왔다. conditional 단일 모델과 unconditional 모델 두 가지가 공개됐으며, 두 모델을 함께 쓸 경우 Flux.2 Klein보다 생성 시간이 더 길어진다. 체리픽 없이 실사 퀄리티를 뽑으려면 시드와 프롬프트를 여러 번 조정해야 한다는 경고도 함께 나왔다. 현장 관점에선 텍스트 삽입이 잦은 키아트·타이포그래피 작업엔 즉시 써볼 만하지만, 실시간 프리뷰가 필요한 현장에선 속도가 발목을 잡을 것이다.

회로 기판 표면을 극단적으로 클로즈업한 오버헤드 매크로 사진 — 차갑고 차분한 청색 톤의 추상적 기술 상징 이미지

🔗 원문 보기 — Ideogram4 GGUF is out!

2. Ideogram 4 ComfyUI 연동: 바운딩박스로 만화 레이아웃 직접 제어 가능

ComfyUI에서 Ideogram 4의 conditional 모델을 활용해 바운딩박스를 직접 배치하면 만화·광고 레이아웃을 구성할 수 있다는 활용 사례가 공개됐다. 오브젝트 위치·색상·구도를 JSON으로 정의한 뒤 Claude 연동 툴로 프롬프트를 자동 생성하는 워크플로도 같이 소개됐다. 비주얼 프롬프트 에디터(드래그앤드롭, 그리드 스냅, 프리셋 지원)를 직접 개발한 유저 사례도 등장했다. 현재 ComfyUI 노드 설정값은 커뮤니티에서 공유 중이며 별도 구독 비용 없이 로컬 구동이 가능하다. 현장 관점에선 스토리보드나 광고 키아트 초안을 잡는 용도로 즉각 실전 투입이 가능한 워크플로다.

🔗 원문 보기 — Ideogram 4 is amazing for comic book pages

3. Ideogram 4 검열 우회법 발견: 시그마 스텝 +0.005 조정으로 블록 거의 사라져

Ideogram 4 로컬 버전에서 작동하는 검열 우회 방법이 두 가지 확인됐다. 첫 번째는 첫 번째 시그마 스텝 값을 +0.005(경우에 따라 +0.01) 올리는 것이며, 이 조정만으로 블록 메시지가 거의 발생하지 않는다고 보고됐다. 두 번째 방법도 별도로 존재하나 공개 범위는 제한적이다. 상업 API 버전이 아닌 오픈소스 로컬 모델에 적용되는 방법이므로 법적 책임은 사용자에게 있다. 현장 관점에선 성인 콘텐츠보다 애매한 폭력 표현이나 브랜드 로고 재현 등 ‘회색지대’ 작업에서 유용할 수 있지만, 클라이언트 납품물에 쓸 때는 사전에 리스크를 명확히 따져야 한다.

🔗 원문 보기 — Ideogram 4: a solution for removing the annoying censorship has been found.

4. Ideogram 4 Arcane 스타일 LoRA 첫 공개, Hugging Face에서 무료 다운로드

Ideogram 4 전용 스타일 LoRA가 처음 공개됐다. Arcane(넷플릭스 애니메이션) 화풍을 재현하는 실험적 LoRA이며 Hugging Face에서 무료로 내려받을 수 있다. 제작자는 Klein·ZiT용 스타일 LoRA도 동일 프로필에서 배포 중이다. 별도의 LoRA 학습 테스트에서는 Ideogram 4가 애니메이션 입력을 유화 스타일로 변환하는 경향이 있어, 순수 애니 스타일을 유지하려면 전용 학습 데이터가 필요하다는 점도 확인됐다. 현장 관점에선 뮤직비디오나 브랜드 필름에서 그래픽노블 룩을 빠르게 테스트해볼 출발점으로 쓸 만하다.

🔗 원문 보기 — Arcane style – Ideogram 4.0 LORA – Experimental

5. GitHub에 ComfyUI 커스텀 노드로 위장한 악성코드 주의보

GitHub에서 ComfyUI 커스텀 노드를 위장한 악성코드 저장소 두 개가 발견됐다. ‘comfyui-custom-node-skills’라는 이름으로 Claude AI 스킬을 제공하는 척 배포됐으며, 설치 시 시스템에 악성 코드가 실행될 수 있다. 저장소 URL은 각각 jtydhr88/comfyui-custom-node-skills와 MusfiqurRahma/comfyui-custom-node-skills로 확인됐다. ComfyUI 생태계 특성상 외부 노드를 자주 설치하는 환경이기 때문에 피해 범위가 클 수 있다. 현장 관점에선 커스텀 노드 설치 전 반드시 GitHub 스타 수·커밋 이력·배포자 신원을 교차 확인해야 하며, 사내 렌더 서버에 연결된 머신이라면 특히 주의가 필요하다.

🔗 원문 보기 — PSA: A possible malware disguised as ComfyUI custom node Claude skills on GitHub

6. WAN2.2 리만 기하학 보간 노드 공개: 첫-마지막 프레임 보간 품질 향상

WAN2.2의 First-Last Frame(첫-마지막 프레임) 생성에 리만 지오데식(Riemannian geodesic) 가이던스를 적용한 ComfyUI 노드 팩이 공개됐다. 개발자에 따르면 직접 보간 대비 움직임 경로가 더 부드럽고 레이턴트 공간에서의 왜곡이 줄어든다. 수학적 기반은 리만 기하학이며, 일반 WAN2.2 FLF와 비교 영상이 함께 공개됐다. 추가 비용 없이 기존 WAN2.2 환경에 노드만 추가하면 작동한다. 현장 관점에선 카메라 무빙이 단순한 광고 컷 전환보다 두 키프레임 사이 피사체 변형이 복잡한 뮤직비디오 씬에서 실질적 차이가 있는지 직접 비교 테스트해볼 가치가 있다.

🔗 원문 보기 — I built ComfyUI nodes that use Riemannian geometry to guide WAN2.2 latent interpolation

7. AMD GPU Windows 환경 ROCm/HIP 자동 설치 스크립트 공개, FP8·GGUF 지원

AMD RX GPU를 Windows에서 쓸 때 DirectML 대신 네이티브 ROCm/HIP를 자동으로 설정해주는 스크립트가 공개됐다. DirectML은 메모리 관리 문제와 Float8_e4m3(FP8), GGUF 포맷을 차단하는 한계가 있었는데, 이 스크립트는 해당 문제를 우회해 FP8·GGUF 모델을 AMD GPU에서 직접 구동할 수 있게 한다. 국내 영상 제작 현장에서 엔비디아 GPU 수급난으로 AMD를 사용하는 경우가 늘고 있는 상황이다. 설치 자동화로 기존 ROCm 수동 설정 대비 진입 장벽이 크게 낮아졌다. 현장 관점에선 RTX 대체재로 AMD를 고려 중이라면 이 스크립트로 ComfyUI 호환성 문제의 상당 부분이 해결되지만, 아직 모든 커스텀 노드가 ROCm을 완전 지원하지는 않으니 사전 검증이 필요하다.

🔗 원문 보기 — Automated Native ROCm/HIP Setup for Windows (DirectML Bypass / FP8 & GGUF Support for AMD RX GPUs)

8. Flux Klein 멀티앵글 LoRA 등장: 단일 프롬프트로 다각도 캐릭터 시트 생성

Flux Klein 9B 전용 멀티앵글 LoRA가 Hugging Face에 공개됐다. Qwen 멀티앵글 카메라 인터랙티브 노드와 조합하면 단일 프롬프트로 정면·측면·후면 등 다각도 캐릭터 시트를 한 번에 생성할 수 있다. LoRA 링크는 Alexali 계정 Hugging Face 프로필에서 확인 가능하다. 캐릭터 일관성 유지가 핵심인 웹드라마·브랜드 마스코트 제작 워크플로에 바로 연결된다. 현장 관점에선 캐릭터 디자인 확정 전 클라이언트 컨펌 단계에서 3D 턴어라운드 대신 쓸 수 있는 빠른 대안으로, 별도 3D 소프트웨어 없이 레퍼런스 시트를 뽑아낼 수 있다는 점이 실질적인 시간 절감 포인트다.

🔗 원문 보기 — Multiple Angles for flux klein

9. Suno 6개월 사용기: 크레딧 낭비가 멜로디 품질 저하로 이어지는 구조적 문제

한국인 유튜버·틱토커가 Suno를 6개월간 사용한 뒤 작성한 관찰 보고가 커뮤니티에 공유됐다. 핵심은 ‘크레딧 낭비’가 단순 비용 문제가 아니라 멜로디 완성도와 직결된다는 점이다. 생성 초반에 무분별하게 크레딧을 소모하면 후반부 편집·수정 단계에서 재생성 여력이 없어지고 결과물의 일관성이 무너진다는 경험이 담겼다. 또한 Suno 서버 측 버그로 계정이 손상됐을 때 고객지원 응답에 2~4주 이상 걸린다는 불만도 함께 제기됐다. 현장 관점에선 Suno를 납기가 있는 상업 프로젝트에 단독으로 쓰는 건 여전히 위험하고, 크레딧 관리 전략을 워크플로에 미리 설계해 두는 것이 필수다.

🔗 원문 보기 — 6 Months with Suno: Why wasting credits ruins the melody (Observations from a casual creator)

10. 킥스타터 영상에 ElevenLabs AI 보이스 쓰면 후원자 반응은 어떨까

크라우드펀딩 캠페인 영상에 AI 보이스(ElevenLabs)를 사용하는 것이 실제 후원자 반응에 영향을 주는지에 대한 논의가 제기됐다. 제기자는 클립 추가·수정 시마다 전문 성우 재녹음 비용이 발생하는 문제를 AI 보이스로 해결하려 했으며, ElevenLabs의 자연스러움이 일반 시청자 기준에서 충분한 수준이라는 판단을 내렸다. 현재까지 ‘일반 후원자’가 AI 보이스를 식별할 수 있는지에 대한 명확한 데이터는 없으나, 기술 인지도가 높아지면서 민감도도 올라가는 추세다. 현장 관점에선 완성도 높은 ElevenLabs 보이스는 대부분의 클라이언트 시사에선 무난하게 통과되지만, 고관여 후원자 대상 캠페인에선 진정성 논란이 변수가 될 수 있다.

🔗 원문 보기 — Do general Kickstarter backers care if a campaign video uses an AI voice?


📱 매일 AI 관련 뉴스 받고 싶으시면 텔레그램 팔로우해주세요!

👉 https://t.me/reelai_kr

매일 오전 9시 발행 · 영상 제작 현장이 알아야 할 핵심만

댓글 남기기