벤치마크 순위가 바뀔 때마다 “이번엔 진짜”라는 말이 업계에 돈다. ArtificialAnalysis 리더보드(2025년 5월 기준) 오픈웨이트 부문에서 FLUX.2 [dev] Turbo(Elo 1164)가 동일 계열의 FLUX.2 dev를 제치고 1위에 올랐고, UltraReal Anima 파인튜닝과 1시간 만에 완성된다는 2.5D LoRA 소식까지 겹치면서 Civitai 피드가 다시 들썩이고 있다. 문제는 이 수치가 광고주한테 납품하는 스틸 한 장과 무슨 관계냐는 것이다.
벤치마크 1위가 납품 기준을 의미하지는 않는다
색재현 정확도, 손·텍스트 안정성, 출력 해상도—광고 스틸 납품에서 실제로 걸리는 기준은 이 세 가지다. 현재 오픈웨이트 최상위권 모델이 이 기준을 완전히 충족한다고 보기는 어렵다. 그렇다고 무시할 수 있는 수준도 아니다. Elo 점수는 인간 선호도 기반 비교 평가라 ‘광고 CD가 OK 사인을 누를 확률’과는 다른 지표다. 벤치마크가 측정하는 건 상대적 선호도이지, 납품 가능한 퀄리티의 절댓값이 아니다. 결론적으로 지금 시점에서 오픈웨이트 모델은 “써봐야 알 수 있는” 단계이지, “쓰면 된다”는 단계가 아니다.

로컬 구동 환경과 세팅 장벽, 실제로 얼마나 높나
FLUX.2 [dev] Turbo 같은 모델을 로컬에서 돌리려면 그에 맞는 GPU가 있어야 한다. 국내 영상 제작 현장에서 이 정도 스펙을 갖춘 팀은 많게 잡아도 30% 수준으로 추정된다. 나머지 70%는 여전히 API 과금 모델에 의존하거나 클라우드 렌더링을 쓴다. 세팅 난이도는 지금 당장은 체감상 높게 느껴지지만, 오픈소스 생태계 발전 속도를 보면 진입 장벽은 빠르게 낮아질 가능성이 크다. ComfyUI 같은 래퍼 툴이 복잡한 의존성 설치를 이미 상당 부분 흡수하고 있고, 이 흐름은 계속된다.

Civitai 라이선스 리스크, 회색지대라고 넘기면 안 된다
솔직히 말하면, Civitai에서 받은 모델의 라이선스를 상업 납품 전에 꼼꼼히 읽는 실무자는 거의 없다. 업계 전반이 그렇다. 그게 현실이고, 동시에 리스크다. 모델마다 라이선스 조건이 다르고—Creative ML OpenRAIL-M부터 완전 상업 허용, 비상업 전용까지—납품 이후 문제가 터졌을 때 책임 소재는 제작사나 프리랜서 개인에게 돌아온다. 여기에 플랫폼 접근성 문제가 더해진다. 국내 공공기관 IP에서는 이미 Civitai 접속이 막혀 있다는 게 현장에서 확인됐고, 영국에서는 2025년 7월 24일 온라인 안전법(OSA) 준수 부담을 이유로 Civitai가 자체적으로 영국 사용자 접근을 차단했다. 유럽 전반에서도 유사한 사례가 보고되고 있다. 1년 안에 국내 접근 제한이 현실화될 가능성은 충분히 있다. 플랫폼 의존 워크플로를 그대로 가져가는 건 지금 당장은 편하지만, 어느 날 갑자기 파이프라인이 막힐 수 있다는 뜻이기도 하다.
1년 후 오픈웨이트가 메인 툴이 될 수 있을까
AI 구독 비용이 숙련 인력 인건비를 넘어서는 사례가 실제로 나오고 있다. 이 비용 구조가 굳어지면 로컬 오픈웨이트 작업 방식의 매력은 지금보다 훨씬 커진다. 1년 후 광고·MV 업계에서 오픈웨이트 모델이 Midjourney나 Adobe Firefly를 대신해 메인 툴로 자리잡을 가능성을 7~8점으로 보는 시각이 있다. 업계가 둘로 갈릴 수 있다는 전망도 나온다—로컬 파이프라인을 구축해 실제작을 병행하는 팀과, 자본력으로 대형 클로즈드 모델을 그대로 쓰는 팀으로. 어느 쪽이 더 나은 선택인지는 지금 당장 결론 내기 어렵다.
벤치마크 1위 모델을 무조건 따라잡아야 한다는 조급함보다는, 자기 워크플로에 실제로 집어넣어 보고 납품 기준을 직접 확인하는 게 먼저다. 수치는 참고용이다.