방송영상을 AI 학습 데이터로…정부, 데이터 구축사업 공모

프라임경제
[프라임경제] 방송영상 콘텐츠가 인공지능(AI) 학습용 데이터로 활용된다. AI 산업의 핵심인 고품질 데이터 수요가 급증하는 가운데, 국내 방송사가 보유한 영상 콘텐츠가 '한국형 AI 모델' 개발의 기반이 될 전망이다.


과학기술정보통신부(이하 과기정통부)와 한국전파진흥협회는 방송·미디어 분야의 AI 전환을 본격화하고, 국산 특화 AI 모델 개발을 지원하기 위해 '방송영상 AI 학습용 데이터 구축사업'을 오는 7월4일까지 공모한다고 5일 밝혔다.

이번 사업은 올해 제1차 추가경정예산으로 확보한 200억원을 투입해 신규 추진된다. 방송사가 보유한 원본 콘텐츠를 AI·데이터 기업과 협력해 학습용 데이터로 가공·검증하는 것이 핵심이다.

지원 대상은 방송사(주관기관)와 AI·데이터 전문기업 또는 기관(참여기관)으로 구성된 컨소시엄이며, 총 4개 컨소시엄을 선정해 각각 48억3000만원 규모의 예산을 지원할 계획이다.

선정된 컨소시엄은 방송영상 원본을 1만 시간 이상 확보하고, 저작권 및 개인정보 이슈가 없는 데이터를 선별해 총 5000시간 이상 분량의 AI 학습용 데이터를 구축해야 한다. 이 과정에서 영상, 이미지 등 다양한 포맷의 고품질 데이터셋이 생산된다.

과기정통부는 전문기관을 통해 각 단계별 품질관리를 수행하고, 검증용 AI 모델을 활용해 데이터의 정확도와 실효성을 평가할 예정이다. 구축된 데이터는 방송 콘텐츠 제작 효율성 향상, 국산 AI 모델 고도화, 글로벌 최고 수준 거대언어모델(LLM) 개발 등 다방면으로 활용된다.

특히 월드 베스트 LLM 프로젝트 수행기관 요청 시 해당 데이터를 제공하고, AI 허브를 통한 연구·교육용 일부 개방도 추진된다.

정부는 이 사업과 연계해 방송영상 AI 학습용 데이터의 거래 활성화를 위한 협의체도 구성한다. 업계 전문가, 학계, 수요기관이 참여하는 이 협의체는 데이터 거래 기준을 마련하고, 그간 미흡했던 거래 체계를 정비해 유통 기반을 조성할 계획이다.

과기정통부는 오는 6월13일 참여 희망 기업을 대상으로 사업설명회를 개최할 예정이다. 자세한 공고 내용은 과기정통부 또는 한국전파진흥협회) 홈페이지에서 확인할 수 있다.

강도성 과기정통부 방송진흥정책관은 "국내 방송사는 지난 70년간 한국 사회의 언어·문화·행동 양식을 풍부하게 축적해온 콘텐츠 자산을 보유하고 있다"며 "방송영상 콘텐츠가 AI 학습의 핵심 자원으로 쓰일 수 있도록 적극 지원하겠다"고 말했다.

Copyright ⓒ 프라임경제 무단 전재 및 재배포 금지
alert

댓글 쓰기 제목 방송영상을 AI 학습 데이터로…정부, 데이터 구축사업 공모

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중