Reve 2.0 – 픽셀‑스페이스 디퓨전 기반 4K 이미지 생성 모델 발표

출처: newsletter · 2026. 6. 4.

Reve는 레이아웃 제어에 특화된 4K 이미지 생성 모델 **Reve 2.0**을 공개했다. 기존 ‘텍스트 → 이미지’ 파이프라인을 탈피해, 이미지 픽셀을 코드처럼 다루는 **Pixel‑space diffusion** 방식을 채택했다. 거대 언어 모델이 텍스트로 연출을 기획한 뒤, 픽셀을 요소별로 분할·태그 부착하여 이미지를 구성한다. 결과적으로 경쟁 모델 대비 **연산량이 10배 이하**로 4K 해상도의 미세 텍스트와 레이아웃 조작을 구현했으며, 출시 직후 Arena.ai 텍스트‑투‑이미지 리더보드 2위에 올랐다. 쉬운 설명: 전통적인 이미지 AI는 “문장을 입력하면 전체 그림을 한 번에 만들어요” 라는 방식이었어요. Reve 2.0은 “그림을 작은 조각(픽셀)마다 따로 따로 코딩하듯 만들어요” 라고 생각하면 됩니다. 그래서 같은 퀄리티를 내면서도 훨씬 적은 컴퓨터 힘으로 4K 수준의 고화질 그림을 만들 수 있어요. 특히 글자나 레이아웃을 정확히 배치하는 데 강점이 있습니다. 관련분야: 컴퓨터 비전·이미지 생성, 멀티모달 AI, Diffusion 모델, 레이아웃·디자인 자동화 원문 보기 →