업스테이지는 NIA와 공동 주최로 한국어 LLM 리더보드인 'Open Ko-LLM 리더보드'를 구축, 오는 27일 개설한다고 밝혔다. 이는 지난 4일 업스테이지와 NIA의 협력 이후 실현된 결과다.
Open Ko-LLM 리더보드는 누구나 자신이 개발한 한국어 LLM 모델을 등록하고 다른 모델과 경쟁할 수 있는 공개 플랫폼이다.리더보드에 관심이 있는 연구자들은 27일 이후 허깅페이스의 Open Ko-LLM 리더보드 스페이스에서 자세한 정보를 확인하고 참여할 수 있다.
회사 관계자는 "Open Ko-LLM 리더보드는 허깅페이스가 운영하는 오픈LLM 리더보드의 기존 데이터를 단순히 번역한 것이 아니라 한국어의 특성과 문화를 반영한 고품질의 데이터를 자체 구축해 한국어 특화 리더보드로서의 강점을 갖는다"고 설명했다.
해당 상식생성 기준을 통해 국내에서 가장 대표적인 할루시네이션(환각 현상)의 예시로 평가되는 '세종대왕의 맥북 던짐 사건' 등의 사례들도 크게 방지할 수 있어 한국어와 역사에 대해 더 적합한 모델을 평가할 수 있다는 평가다.
Open Ko-LLM 리더보드는 한국어 LLM 연구의 수준과 경쟁력을 높이고, 한국어 데이터의 양과 질을 개선하며 한국어 LLM의 국제적 인지도를 높일 것으로 기대를 모으고 있다. 오픈LLM 리더보드를 토대로 다양한 연구자들의 결과를 공유하고 공동 연구·협력을 촉진할 수 있으며 이를 통한 성능 수준의 향상과 산업 분야 확대에도 기여할 것으로 예상된다. 또 한국어 데이터를 바탕으로 리더보드가 개설됨으로써 공개 연구결과의 투명성과 신뢰성을 확보함은 물론 국제적 인지도를 제고, 다양한 언어 연구 활성화의 시작점이 될 전망이다.
이번 리더보드 개설에는 최근 발표된 업스테이지와 KT의 협업도 기여했다. AI 생태계 확대에 양사가 힘을 합쳐 KT클라우드의 인프라 지원을 통해 리더보드가 안정적으로 운영될 예정이다.
업스테이지는 한국어 리더보드를 구축함으로써, 1T클럽을 토대로 한 한국어 데이터를 바탕으로 고품질의 LLM을 개발하는 것을 넘어 국내 LLM '독립'을 위한 생태계 조성에 기여할 계획이다. 김성훈 업스테이지 대표는 "앞으로도 1T클럽을 포함한 고품질 한국어 데이터 공유는 물론, 리더보드를 통한 협업 촉진과 빠른 기술 전파 등을 통해 한국 AI 생태계를 넓히고 발전을 증진시킬 수 있도록 더욱 노력할 것"이라고 말했다.
앞서 업스테이지의 LLM인 '솔라'는 지난 8월 허깅페이스가 운영하는 오픈 LLM 리더보드에서 챗GPT의 벤치마크 점수를 넘는 결과로 세계 1위를 차지했다. 최근에는 오픈AI의 챗GPT, 구글의 팜(PaLM), 메타 라마(LLama), 엔트로픽 클로드 등만 리스트에 올라 고성능 LLM 모델의 기준이 된 Poe의 메인모델로 솔라가 등록되기도 했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지