블록체인 및 핀테크 기업 두나무는 자사 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 글로벌 AI 모델 평가 지표인 BIRD-SQL에서 글로벌 리더보드 1위를 달성했다고 25일 밝혔다.
텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로, 생성형 AI의 등장 이후 큰 관심을 받고 있는 연구 분야다.
두나무 머신러닝팀이 이번에 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출, 챗GPT의 성능을 한층 강화시키는 것이 특징이다.
특히 AI 모델 성능 측정 벤치마크인 BIRD-SQL(A Big Bench for Large-Scale Database Grounded Text-to-SQLs)의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 각각 받으며 모두 1위에 올랐다. 이는 GPT-4의 정확도(54.8%)와 효율성(60.7%)을 각각 10% 이상 상회하는 수치다. 2위 모델과도 정확도 항목에서 4.7%, 효율성에서 3.6%의 높은 성능 격차를 기록했다. 처음 1위에 오른 1월 14일 이후 현재까지도 계속 선두를 지키고 있다.
두나무는 이번 연구를 통해 증권플러스에서 제공하는 인공지능 대화형 서비스 ‘우디’의 자연어를 통한 종목 스크리닝 성능을 크게 향상시킬 수 있을 것으로 기대한다고 밝혔다.
이동준 두나무 머신러닝팀장은 “챗GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 두나무는 보다 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다”며 “명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는데 초점을 맞춰 두나무의 다양한 서비스 향상에 기여하도록 노력하겠다”고 말했다.
두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발하고 있다. 현재 AI 모델링 및 튜닝, 모델 평가 매트릭 설정 등 다양한 데이터를 발굴해 두나무의 다양한 서비스에 활용하고 있다.