챗GPT 돌풍 속에서 네이버와 카카오가 ‘한국어 잘하는 인공지능(AI)’으로 승부수를 띄우고 있다. 한국어 질문에 답변이 부실하다는 챗GPT의 약점을 파고든 전략이다.
5일 업계에 따르면 네이버에서 오는 7월 공개하는 초대규모 AI ‘하이퍼클로바X’의 가장 큰 특징은 ‘챗GPT 대비 한국어 학습량이 6500배 많다’는 것이다. 하이퍼클로바X는 기존 하이퍼클로바를 토대로 사용자가 요구하는 응답을 즉시 제공하도록 업그레이드한 기술이다. 그동안 하이퍼클로바의 학습 데이터가 주로 한국어로 이루어진 만큼, 한국어에 최적화된 AI 언어 모델이라는 게 네이버 측 설명이다. 영어 데이터 기반인 챗GPT가 최근 한국어로 된 질문에 부정확한 답변을 내놓은 사례가 여럿 알려지면서 시장에선 신뢰성에 의문을 제기하고 있다.
지난 2021년 5월 공개된 하이퍼클로바는 오픈AI에서 개발한 시스템 GPT-3의 1750억개보다 많은 2040억개의 매개변수(파라미터)를 갖췄다. 파라미터는 인간의 뇌에서 뉴런끼리 정보를 전달하는 통로인 ‘시냅스’에 해당한다. AI의 인공신경망인 셈이다. 다만 오픈AI에서 연내 GPT-4를 공개할 예정으로 알려지면서, 더 나아진 챗GPT가 또 다른 ‘특이점’을 가져올지 지켜봐야 한다.
카카오의 AI 자회사 카카오브레인은 올해 상반기 한국어에 특화한 AI 언어 모델 ‘코(Ko)GPT’의 새 버전을 출시할 계획이다. 김광섭 카카오브레인 최고기술책임자(CTO)는 지난 2일 온라인 기업설명회에서 “초거대 한국어 텍스트 생성 모델에 대한 기반 기술을 보유하고 있다. 적어도 한국에서는 언어 모델에 있어 압도적 경쟁력을 가질 수 있도록 투자를 아끼지 않을 예정”이라고 강조했다. 카카오브레인은 코GPT를 바탕으로 한 AI 챗봇 서비스 ‘코챗 GPT’도 연내 출시한다. 현재 카카오브레인은 4000대 이상의 최신 그래픽처리장치(GPU)를 보유하고 있는 등 생성 AI 분야를 위한 인프라 마련에 힘쓰고 있다.
조민아 기자 minajo@kmib.co.kr