국가대표 AI 1차 관문 임박…정부 ‘독자성 판단’에 운명 갈린다

마이데일리
배경훈(왼쪽 다섯 번째부터) 부총리 겸 과학기술정보통신부 장관, 하정우 청와대 AI미래기획수석 등이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에 참석해 기념촬영을 하고 있다. /뉴시스

[마이데일리 = 박성규 기자] 국가대표 인공지능(AI) 프로젝트가 첫 관문을 앞두고 있다. 이번 평가의 변수는 어디까지를 ‘독자 개발’로 인정할지에 대한 정부 판단이다.

13일 IT(정보 기술) 업계에 따르면 정부가 추진 중인 독자 AI 파운데이션 모델 프로젝트의 1차 평가가 오는 15일 마감된다. 현재 정예팀 5곳 가운데 1곳이 탈락할 예정이다. 발표 시점은 이번 주가 유력하지만 평가 근거를 둘러싼 논란을 감안해 다소 늦춰질 가능성도 거론된다.

국가대표 AI 선발전이 시작되자 마자 기업들간 성능 경쟁은 치열하게 펼쳐졌다. 참가 기업들은 최근 기술보고서를 공개하며 모델 구조와 학습 방식, 주요 벤치마크 결과를 제시했다. 전반적인 지표에서는 LG AI연구원과 SK텔레콤이 상위권 평가를 받았다는 분석이 나온다. 네이버클라우드는 멀티모달 전략으로 차별화를 시도했고 엔씨소프트와 업스테이지는 산업 특화 모델을 앞세웠다.

그러나 평가가 진행될수록 무게 중심은 '성능'에서 '독자성 기준'으로 빠르게 이동했다. 일부 모델의 개발 과정에서 해외 AI 기술 활용 여부가 도마에 오르면서 ‘프롬 스크래치(학습 가중치를 처음부터 자체 생성한 방식)’ 기준이 최대 쟁점으로 부상했다. 업계가 주목하는 핵심은 가중치다. 학습을 통해 형성된 판단 기준을 외부에서 가져왔는지 여부가 독자성 판단의 경계선으로 작용하고 있다.

하정우 청와대 AI미래기획수석이 30일 오후 서울 강남구 코엑스에서 열린 독자 AI 파운데이션 모델 프로젝트 1차 발표회에서 네이버클라우드 부스를 살펴보고 있다. /뉴시스

공개된 추론 코드 활용을 둘러싼 논란과 달리 가중치 차용 문제는 성격이 다르다는 평가가 많다. 추론 코드는 글로벌 표준에 가까운 공개 영역이지만 가중치는 모델의 사고방식 자체를 규정한다. 어떤 데이터를 어떻게 학습했는지가 그대로 반영되기 때문이다. 이 때문에 입력 단계에서 사용되는 비전·오디오 인코더 가중치 등은 독자성 판단에서 더 엄격하게 다뤄질 수 있다는 관측이 나온다.

최근 불거진 토큰화 방식 논쟁도 같은 맥락이다. 숫자를 한 자리씩 분해해 처리하는 방식이 특정 해외 모델과 유사하다는 지적이 제기됐지만 업계에서는 수학·코딩 추론 성능을 높이기 위해 널리 활용되는 일반적 선택이라는 반론도 나온다. 다만 이 역시 독자성의 본질인 학습 데이터와 가중치 문제와는 구분해야 한다는 시각이 우세하다.

결국 최종 판단은 과학기술정보통신부가 맡게 됐다. 아직 독자성 기준에 대한 명문화된 가이드라인은 없다. 다만 모든 후보가 데이터 구성, 사전학습과 미세조정 과정, 외부 기술 활용 범위를 담은 개발 기록을 제출한 만큼 정부는 이를 근거로 종합 판단에 나설 전망이다.

이번 1차 탈락은 단순한 순위 경쟁 이상의 의미를 갖는다. 첫 기준 설정이 향후 국가대표 AI 사업 전반과 ‘소버린 AI’ 정책 방향을 사실상 규정하게 된다.

한 IT 업계 관계자는 “이번 판단은 한 팀을 떨어뜨리는 문제가 아니라 한국형 독자 AI의 허용선이 어디까지인지 보여주는 신호”라며 “기준이 불분명하면 논란은 다음 단계에서도 반복될 수밖에 없다”고 말했다.

Copyright ⓒ 마이데일리 무단 전재 및 재배포 금지
alert

댓글 쓰기 제목 국가대표 AI 1차 관문 임박…정부 ‘독자성 판단’에 운명 갈린다

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중