SK텔레콤, 국립국어원과 AI한국어 모델 개발 협력

Home > > 기사내용

SK텔레콤, 국립국어원과 AI한국어 모델 개발 협력

cnbnews 선명규기자 | 2021.04.08 09:50:04

SK텔레콤 데이비스 에릭 하트먼 Language Superintelligence Labs장(왼쪽)과 국립국어원 정희원 어문연구실장 (사진=SK텔레콤)

SK텔레콤이 국립국어원과 업무 협약을 체결하고, 국립국어원의 언어 정보를 활용하여 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발하기로 했다고 7일 밝혔다.

차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3와 유사한 성능을 발휘하는 한국어 범용 언어 모델(이하 GLM, General-Purpose Language Model)로, 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에서도 구현할 수 있게 된다.

GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있으며, 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대된다.

SKT가 개발하는 GLM은 1500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정이다. 매개변수란 서로 다른 함수에 공통적으로 영향을 미치는 변수로, 일반적으로 매개변수가 많을수록 언어 모델의 성능이 높아진다.

최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크고, 보다 높은 정확도와 넓은 활용도를 갖고 있는 점을 감안하면, GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상된다.

SKT는 올해 말까지 GLM을 개발하여 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이며, 다양한 서비스에도 적용할 계획이다. 또한, 한국어 언어모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이다.

SKT는 2018년부터 AI 언어모델을 개발해 왔으며, 2019년 KoBERT를 개발하여 챗봇 등에 활용하고 있다. 2020년 4월 KoGPT-2를 개발 완료하여 챗봇의 대화를 보다 자연스럽게 발전시켰으며, ‘20년 10월에는 뉴스나 문서를 고품질 요약문으로 만들어내는 능력 등 텍스트 처리 역량이 뛰어난 KoBART를 개발해 자연어 이해/처리 영역의 기술력을 강화해 왔다.

이와 함께 국립국어원은 ‘21년 국어 정보처리 시스템 경진대회’를 SKT의 AI 언어 모델을 활용하여 AI의 언어소통 능력을 겨루는 방식으로 개편하여 한글 주간에 개최하기로 했다.

☞ CNB뉴스 선명규 기자의 다른기사 보기

주요 기사

: 공수처, ‘쌍방울 대북송금’ 다시 살핀다…‘檢 직권남…

: [이색사회공헌(73)] “봉사로 단합”…대한항공의…

: SK텔레콤, AI 통합 관제 시스템으로 벚꽃 축제 안정적…

: 한국지역난방공사, ‘대국민 에너지 절약 거리 캠페인’…

: 내란 특검, 尹 체포방해 항소심도 징역 10년 구형…29일…

: ‘이재명 대북 송금’ 담당 검사 직무정지 논란…정성호…

: 포스코그룹, 로봇 자동화 솔루션 기업 ‘브릴스’에 투…

: 與, 초대 전남광주특별시장, 김영록·민형배 맞대결……

주요기사

공수처, ‘쌍방울 대북송금’ 다시 살핀다…‘檢 직권남용’…

: 고위공직자범죄수사처(공수처)는 한 시민이쌍방…

포토뉴스

: [포토] 밀양 종남산 진달래…

ⓒ 2004~2024 Copyright by CNBNEWS. All rights reserved. (주)CNB미디어 사업자등록번호 : 206-81-40424 전화 02-396-3733 FAX:02-396-7330
대표이사 : 황용철 서울시 서대문구 연희로 52-20 정기간행물 등록번호 : 서울아00105 (2005.11.7) 발행일 : 2005.4.11 CNB뉴스 발행인·편집인: 황용철, 편집국장 : 도기천,
청소년보호책임자 : 류창림, CNB뉴스에 실린 내용 중 제휴기사, 칼럼 등 일부 내용은 CNB뉴스의 공식 견해와 다를 수 있습니다.