데이터셋 확장 학습…편집·변환 기능 추가
체험판도 함께 공개…접근성·활용성 개선

칼로로 생성한 토끼 이미지. 사진. 카카오브레인.
칼로로 생성한 토끼 이미지. 사진. 카카오브레인.

[데일리임팩트 변윤재 기자] 카카오브레인이 인공지능(AI) 이미지 모델인 칼로를 응용프로그램 인터페이스(API)를 형태로 공개했다. 접근성을 높여 다방면에서 활용될 수 있도록 했다. 

9일 카카오브레인은 제시어에 따라 다양한 화풍으로 이미지를 생성·편집·변환할 수 있는 칼로 API를 개발자 전용 사이트인 카카오디벨로퍼스에서 공개했다. 카카오디벨로퍼스를 통해 웹 서비스, 모바일 앱, 기타 응용 프로그램 개발에 필요한 플랫폼과 기능을 카카오 서비스와 연계할 수 있다. 카카오 관계자는 데일리임팩트에 “AI 기술이나 카카오톡을 활용하려는 파트너, 개인 모두 사용할 수 있다“면서 “자사의 기술이나 오픈 API를 활용해 AI 서비스를 만들 수 있다“고 설명했다. 

이번에 공개된 칼로 API는 성능이 향상됐다. 지난해의 경우, 1억2000만장 규모의 텍스트-이미지 데이터셋을 학습했는데 칼로 API는 학습 데이터셋 규모를 1억8000만장으로 확장했다. 또 생성한 이미지를 이용자의 의도에 따라 편집·변환하는 기능을 추가해 활용도를 높였다.

카카오브레인은 창의력이 요구되는 분야에서 예술 창작 분야에서 칼로 API를 도구로 쓸 수 있을 것으로 예상하고 있다. 창작자가 입력한 “유화로 그린 검은 토끼(a black rabbit in the style of an oil painting)”라는 제시어에 따라 칼로가 검은 토끼의 이미지를 유화 화풍으로 그리면 이를 썸네일로 활용하는 식이다. 여기에 토끼 얼굴 영역을 선택하고 “왕관을 쓴 검은 토끼(a black rabbit with a crown)”라는 제시어를 추가하면, 다시 기존 이미지를 바꿀 수 있다. 

특히 신규 브랜드 로고나 포스터 디자인, 작품의 영감을 얻는 도구로도 쓸 수 있다는 게 카카오브레인의 설명이다. 작품의 핵심 주제와 연관성이 높은 이미지를 업로드하면 칼로가 다양한 이미지를 만들고 여기서 착안한 아이디어를 작품화하는 식이다. 

이용자는 추가 제휴를 통해 유료 API를 사용할 수 있다. 이용 건수 구간과 약정 기간에 따라 할인받을 수 있다. 카카오브레인은 오는 4월 30일까지 구매하면 1년간 추가로 20% 할인해 줄 계획이다. 

카카오브레인은 체험판을 함께 공개했다. 매달 정해진 횟수 안에서 칼로 기능을 사용할 수 있으며, 회당 최대 3장의 이미지를 생성·편집·변환할 수 있다. 

카카오브레인은 향후 추가적인 데이터셋 학습과 함께, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 이미지 아웃페인팅 같은 기능을 넣어 모델을 고도화할 방침이다. 

김일두 카카오브레인 대표는 “이번에 공개한 칼로 API 및 체험판을 통해 더 많은 사람들이 카카오브레인의 혁신적인 AI 이미지 생성 기술을 접할 수 있기를 바란다”며 “카카오브레인은 꾸준한 연구개발을 통해 칼로의 성능을 고도화하고 이를 다양한 형태로 공개하며 활용 범위를 꾸준히 확대할 것”이라고 말했다.

한편, 칼로는 초거대 이미지 생성 AI 모델을 페르소나로 재탄생시킨 AI아티스트다. 이용자가 입력한 제시어의 내용을 이해한 후 다양한 화풍과 스타일로 단 하나뿐인 이미지를 생성한다. 

관련기사

저작권자 © 데일리임팩트 무단전재 및 재배포 금지