韓 업스테이지표 생성AI, GPT 3.5 성능 뛰어넘었다

최연두 기자입력 2023-08-01 11:28

기사공유
폰트크기

허깅페이스 '오픈 LLM 리더보드' 1위 기록

사진업스테이지김성훈 업스테이지 대표가 16일 서울 을지로 페럼타워에서 열린 기자간담회에서 발표하고 있다 — 김성훈 업스테이지 대표가 지난 5월16일 서울 을지로 페럼타워에서 열린 기자간담회에서 발표하고 있다. [사진=업스테이지]

인공지능(AI) 스타트업 업스테이지는 자사가 개발한 생성AI 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 LLM(거대 언어모델) 리더보드' 평가에서 1위에 올랐다고 밝혔다. 이는 미국 오픈AI의 챗GPT 기반인 GPT-3.5 성능을 넘어선 기록이다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4개 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.

앞서 지난달 업스테이지가 허깅페이스를 통해 공개한 300억 매개변수 모델은 평균 67점을 획득, 같은 날 발표된 메타의 '라마2'(700억 매개변수 모델)를 추월하고 국내 LLM 최초 1위 달성이라는 쾌거를 올린 바 있다.

업스테이지는 더 많은 데이터로 라마2 기반 파인튜닝한 모델을 내놓으며 글로벌 1위 굳히기에 나섰다. 그 결과 새롭게 공개된 업스테이지 700억 모델은 리더보드 평가에서 72.3점을 기록했다. 미국 스태빌리티 AI의 '스테이블 벨루가2' 모델(71.4점)을 뛰어넘고 세계 1위를 재탈환한 것이다.

관련기사

특히 업스테이지의 이번 최신 모델은 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수를 넘겼다는 점에서 의미가 있다. 허깅페이스 리더보드 기준 생성 AI 모델의 대명사 격인 GPT-3.5의 점수를 능가한 사례는 업스테이지가 최초이기 때문이다.

앞으로 업스테이지는 자사 AI 모델 상용화를 통해 본격적인 '프라이빗 AI' 시장 개척에 나선다. 프라이빗AI는 기업 내부 데이터만 학습해 정보 유출을 막으면서 잘못된 정보를 생성하는 환각 현상을 방지하는데 특화된 솔루션이다. 기업 고객은 보안이 강화된 최신 생성AI를 손쉽게 구축하고 활용할 수 있다.

김성훈 업스테이지 대표는 "당사 생성AI 모델이 챗GPT를 능가하는 성능으로 세계 최고 수준의 기술력을 확인하게 돼 기쁘다"며 "압도적인 기술력을 바탕으로 국내외 프라이빗AI 시장 지배력 강화에 박차를 가할 것"이라고 말했다.