
[마이데일리 = 박성규 기자] 정부가 추진 중인 국가대표 AI 파운데이션 모델 사업의 1차 평가 구도가 윤곽을 드러냈다. 성능 지표에서는 LG가 앞섰고, 활용성과 개방성에서는 SK텔레콤과 NC AI가 두드러졌다. 동시에 정부는 평가 기간을 연장하며 검증 강도를 높였다.
12일 IT(정보기술) 업계에 따르면 국가대표 AI 개발에 참여한 5개 정예팀이 공개한 기술 보고서 기준 주요 벤치마크 결과에서 LG AI연구원의 ‘K-엑사원(EXAONE)’이 전반적으로 가장 높은 성능을 기록했다. 독자 AI 프로젝트 1차 평가에 포함된 13개 벤치마크 가운데 10개에서 1위를 차지했고, 전체 평균 점수도 가장 높았다.
한국어 전문 지식과 고난도 문제 해결력을 측정하는 ‘KMMLU-Pro’에서는 SK텔레콤이 68.1점으로 근소하게 앞섰고, LG AI연구원이 67.3점으로 뒤를 이었다. 반면 영어 중심의 종합 지식과 다중 추론 능력을 보는 ‘MMLU-Pro’에서는 LG AI연구원이 83.8점으로 1위를 기록했다. 수학(AIME 2025)과 코딩(LiveCodeBench) 영역에서도 LG가 상대적으로 높은 점수를 받았다.
업계에서는 벤치마크가 각 사 자체 테스트 결과라는 점에서 절대 비교에는 한계가 있지만, 전반적인 지표 흐름만 놓고 보면 LG가 성능 면에서 한 발 앞섰다는 평가가 나온다. LG AI연구원은 자사 모델이 알리바바 ‘큐웬3 235B’와 오픈AI의 ‘GPT-OSS 120B’를 상회하는 성능을 보였다고 설명했다.

반면 개방성과 활용성 측면에서는 다른 그림이 나타났다. SK텔레콤과 NC AI는 각각 아파치 2.0과 MIT 라이선스를 적용해 상업적 활용과 수정·재배포가 자유로운 구조를 채택했다. 업스테이지 역시 아파치 2.0 기반이지만, 파생 모델 명칭에 자사 브랜드를 표기해야 하는 추가 조건을 뒀다. 네이버는 자체 라이선스를 적용해 상업적 이용은 허용하되, 서비스 영역이 겹칠 경우 별도 협의를 요구한다. LG AI연구원은 연구 목적 중심의 활용만 허용하는 정책을 유지하고 있다.
이런 가운데 과학기술정보통신부는 독자 AI 모델 평가 기간을 당초 계획보다 연장했다. 정보통신산업진흥원은 평가단이 각 컨소시엄의 모델을 검증하는 전용 사이트 운영을 54시간 추가로 연장해 달라고 요청했고, 이는 과기정통부 판단에 따른 조치로 전해졌다.
과기정통부는 평가 기간 연장이 최근 불거진 독자 기술력 논란과는 무관하다는 입장이다. 선정 일정 역시 기존 계획대로 진행한다는 설명이다. 다만 업계에서는 정부가 성능뿐 아니라 구조·라이선스·지속 가능성까지 종합적으로 들여다보겠다는 신호라는 해석이 나온다.
IT 업계 한 관계자는 “1차 평가는 단순 순위 경쟁이 아니라, 국가가 어떤 AI를 ‘대표 모델’로 삼을지에 대한 기준을 정립하는 과정”이라며 “성능과 개방성, 기술 주권을 어떻게 균형 있게 볼지가 관건”이라고 말했다.
Copyright ⓒ 마이데일리 무단 전재 및 재배포 금지
--comment--
첫 번째 댓글을 작성해 보세요.
댓글 바로가기