네이버 서치GPT·카카오 코챗GPT 연내 출시
한국어 데이터 집중 학습…정확도·활용성 높아
특화 서비스에 방점…"글로벌 시장 고려해야"

지난 달 27일 개막한 데뷰2023에서 ‘SearchGPT 프로젝트’에 대해 설명 중인 김용범 네이버 서치US 치프 사이언티스트. 사진. 네이버.
지난 달 27일 개막한 데뷰2023에서 ‘SearchGPT 프로젝트’에 대해 설명 중인 김용범 네이버 서치US 치프 사이언티스트. 사진. 네이버.

[데일리임팩트 황재희 기자] 챗GPT 열풍에 맞서 국내 빅테크 기업들의 초거대 인공지능(AI) 출사표가 이어질 전망이다. 

챗GPT는 영어로 된 데이터 위주로 학습한 까닭에 한국어에 약하다. 이에 국내 기업은 한국어에 특화된 생성형 AI를 내놓고 사업 기회를 모색하겠다는 전략이다. 챗GPT가 한국의 문화, 역사 등에 대한 질문을 던졌을 때 부정확한 답변을 내놓는 점을 고려하면 이 같은 전략은 당분간 유효할 수 있다. 

다만 한국어 특화 AI에 집중할 경우, 글로벌 경쟁에서 뒤쳐질 수 있다는 우려가 제기된다. 

챗GPT 대항마 만드는 네카오

9일 IT업계에 따르면 네이버와 카카오는 올 상반기 챗GPT 에 맞설 토종 AI 출시를 예고했다. 네이버는 오는 7월 서치GPT를, 카카오는 AI자회사 카카오브레인을 통해 AI챗봇 서비스 코챗GPT를 3분기에 공개한다.

양사가 내세우는 토종 AI의 강점은 한국어 활용성이다. 지난해 11월 미국 스타트업인 오픈AI가 개발한 챗GPT는 영어를 기반으로 개발된 만큼 이용자가 한국어로 문답을 시행할 경우 오류가 다수 발견되고 답변도 제한적이라는 평가가 나오고 있다. 한국어 기반의 웹콘텐츠의 비중이 영어에 비해 낮아 챗GPT가 습득한 한국어 데이터 양이 부족해서다. 

반면 서치GPT와 코챗GPT는 한국어 고도화 서비스로 경쟁력을 내세우고 있다. 챗GPT에 비해 한국의 역사, 문화 등 국내 산업과 환경에 맞는 고품질 한국어 정보를 AI에게 학습시켜 질문을 했을 때 사용자의 의도에 맞춘 정확한 답변과 결과물을 내놓을 수 있도록 차별화했다는 것이다.

이를 위해 네이버, 카카오는 생성형 AI의 기반이 되는 초거대AI에 집중적으로 한국어를 학습시켰다. 네이버의 하이버클로바X 기존 챗GPT에 비교해 6500배 많은 양의 한국어 데이터를 학습했다. 카카오브레인의 초거대AI 언어모델, 코GPT 3.5 역시 한국어에 특화됐다는 점을 내세우고 있다. 김광섭 카카오브레인 최고기술책임자(CTO)는 지난 3일 열린 기업설명회에서 "AI의 언어 학습을 위해 굉장히 많은 양의 고품질 데이터셋을 모으고 정제해 언어 모델을 완성한만큼 한국어에서는 자신있다"고 밝혔다. 현재 공개된 코GPT는 3000억개 토큰의 한국어 데이터를 학습해 요약, 추론, 긍·부정 판단, 문맥 이해 등 언어로 활용할 수 있는 모든 과제를 수행 가능하다. 

한국어에 특화돼 있다 해도 양사의 주력 사업이 다른 만큼 서비스 방향은 다르다. 네이버는 서치GPT를 자사의 차세대 검색 서비스로 선보일 계획이다. 쇼핑, 페이, 지도 등과 같은 네이버 기존 서비스와의 유기적인 연동을 통해 사용자의 검색 의도에 최적화된 정보를 제공할 예정이다. 반면 카카오는 카카오톡 등 메신저에 강한 만큼 챗봇 서비스 등 버티컬 영역에 접목하는 방안이 검토되고 있다.

카카오브레인이 이달 초 온라인 기업설명회에서 코챗GPT 출시 계획을 밝혔다. 사진. 카카오.
카카오브레인이 이달 초 온라인 기업설명회에서 코챗GPT 출시 계획을 밝혔다. 사진. 카카오.

고성장 생성형 AI 도전장     

초거대 AI가 주목받는 이유는 이를 활용해 다양한 영역으로 확장할 수 있어서다. 생성형 AI가 대표적이다. 생성형 AI는 데이터를 기반으로 새로운 정보를 생성한다. 자연서, 이미지, 음악 등과 관련한 데이터를 학습한 뒤 이용자의 목적에 맞는 결과를 보여주는 식이다. 챗GPT로 주목받고 있는 대화형 AI도 생성형 AI의 일종이다. 

생성형 AI 시장은 빠르게 성장 중이다. 이미 지난해 전 세계 시장 규모가 13조원에 달했다. AI를 활용한 서비스와 제품이 증가함에 따라 비약적으로 성장 중이기도 하다. 연평균 약 35%씩 성장해  2030년에는 약 142조원까지 늘어날 전망이다. 고성장의 수혜를 입기 위해선 더 신속하게, 다양한 이용자의 요구를 반영할 수 있는 기술을 갖춰야 한다. 네이버와 카카오도 마찬가지다. 

대규모 언어모델 매개변수로만 보면 네이버의 하이퍼클로바는 2040억개로 1750억개인 챗GPT보다 성능이 뛰어나지만, 조만간 챗GPT-4 버전이 매개변수 1조개를 선보인다는 예고에 안심하기 이르다는 지적이 나온다. 카카오의 경우 코챗GPT에 적용되는 코GPT-3.5의 매개변수는 60억개 수준으로 글로벌 수준에는 미치지 못한다. 다만 네이버, 카카오는 상용 서비스를 빠르게 출시하는 데 목적을 두고 있는 만큼, 매개변수를 키우는 글로벌 빅테크들과 지향점이 다를 수밖에 없다는 지적도 있다. 

문제는 네이버, 카카오가 국내 시장을 우선으로 하고 있다는 점이다. 두 회사 모두 해외 진출을 통해 글로벌 매출 비중을 높이겠다고 선언했는데, 기술 역시 같은 방향성을 추구해야 한다. 한국어 특화 모델이 시장 경쟁력을 떨어뜨리는 요소가 될 수 있다는 뜻이다. IT업계 관계자는 데일리임팩트에 "국내 기업들이 초거대 AI 개발을 위해 막대한 규모의 투자를 진행했고 앞으로도 지속적인 비용이 투입될 것으로 보인다"며 "내수용에만 한정된 서비스로는 장기적인 수익 창출에 한계가 있을 수 밖에 없다"고 지적했다.  

이에 따라 언어에 구애받지 않는 기술과 모델로 해외시장 진출에도 속도를 낼 필요가 있다는 지적이다. 네이버의 경우 삼성전자와 공동 개발하고 있는 AI반도체가 대안이 될 수 있다. 이 제품은 기존 GPU 대비 1/10 크기의 사이즈, 4배 이상의 전력 효율성을 갖춘 경량화된 AI반도체 솔루션으로 경쟁력이 높을 것으로 기대되고 있다. 

카카오브레인은 이미지 생성 모델 칼로가 해외 시장을 공략할 대안으로 손꼽히고 있다. 몇 가지 제시어만으로 AI가 이미지를 수 초만에 다량 만들어주는 서비스로, 이미지 특화 AI모델인만큼 글로벌 시장에서도 충분히 승산이 있을 것으로 전망된다.

관련기사

저작권자 © 데일리임팩트 무단전재 및 재배포 금지