
시사위크=박설민 기자 최근 생성형 인공지능(AI) 기반 이미지 생성 모델은 다양한 산업 분야에서 활용도가 높아지고 있다. 하지만 ‘창의적인’이란 텍스트 입력에 따른 제대로 된 이미지 생성은 아직도 제한적인 수준이다
국내 연구진이 생성형 AI의 ‘창의성’을 한 단계 높일 수 있는 기술 개발에 성공했다. 한국과학기술원(KAIST) 김재철AI대학원의 최재식 교수 연구팀은 추가적 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다고 19일 밝혔다. 이번 연구는 네이버(NAVER) AI Lab과 공동 연구로 진행됐다.
최재식 교수팀은 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 기술을 개발했다. 또한 모델 내부의 얕은 블록들이 창의적 생성에 중요한 역할을 한다는 것을 발견했다.
연구팀은 창의성을 정의하는 두 가지 핵심 요소인 독창성과 유용성을 모두 고려했다. 이를 통해 생성 모델 내부의 각 블록 별로 최적의 증폭 값을 자동으로 선택하는 알고리즘을 제시했다.

개발된 알고리즘을 통해 사전 학습된 이미지 생성 AI ‘스테이블 디퓨전’ 모델의 내부 특징 맵을 적절히 증폭시켰다. 그 결과, 추가적인 분류 데이터나 학습 없이 창의적 생성을 강화할 수 있었다.
특히 스테이블 디퓨전 XL(SDXL) 모델의 이미지 생성 속도를 대폭 향상하기 위해 개발된 ‘SDXL-Turbo’ 모델에서 발생하는 모드 붕괴 문제도 완화했다. 이미지 다양성이 증가한 것을 확인했다. 뿐만 아니라 사용자 연구를 통해 사람이 직접 평가했을 때도 기존 방법에 비해 유용성 대비 참신성이 크게 향상됨을 입증했다.
연구 제1저자인 한지연, 권다희 KAIST 박사과정은 “생성 모델을 새로 학습하거나 미세조정 학습하지 않고 생성 모델의 창의적인 생성을 강화하는 최초의 방법론”이라며 “학습된 인공지능 생성 모델 내부에 잠재된 창의성을 특징 맵 조작을 통해 강화할 수 있음을 보였다ˮ고 말했다.
이번 연구 성과는 국제학술지 ‘국제 컴퓨터 비전 및 패턴인식 학술대회(IEEE Conference on Computer Vision and Pattern Recognition, CVPR)’에서 지난 15일 발표됐다.
Copyright ⓒ 시사위크 무단 전재 및 재배포 금지
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기