아크릴, 글로벌 1·2위 美 클라우드기업과 GPU 최적화 기술 대규모 성능 검증 착수

프라임경제

[프라임경제] 인공지능 전환(AX) 인프라 전문기업 아크릴이 미국 소재 글로벌 1·2위 클라우드 서비스 기업과 협력해 GPU 클러스터 최적화 기술 '조나단 GPU베이스(GPUBASE)'의 대규모 성능 검증 프로젝트 'K-Scale Evaluation'에 공식 착수했다고 31일 밝혔다.

이번 프로젝트는 GPU 248장 규모로 글로벌 클라우드 환경에서 GPUBASE의 성능·확장성·안정성을 7개 항목으로 정량 검증한다. 

AI 모델 학습·추론 워크로드를 활용해 실제 운영 환경과 유사한 조건에서 검증이 이뤄지며, 한국어 특화 대규모 언어모델과 자사의 의료 AI 모델 ‘아름.H(ALLM.H)’가 테스트 워크로드로 활용된다.

아크릴은 이번 프로젝트를 'Horizontal K-Scale'과 'Vertical K-Scale' 두 축으로 설계했다. 먼저 'Horizontal K-Scale'은 복수의 클라우드 환경에 각각 수백 대 규모 GPUBASE를 배치해, 누적 1000장 이상의 GPU에서 환경 호환성과 운영 안정성을 검증하는 방식이다. 

현재 3개 이상의 클라우드 기업과 협력 중이며, 인피니벤드(InfiniBand), 이더넷 기반 RDMA(Ethernet·RoCEv2) 등 서로 다른 네트워크 환경과 엔비디아, AMD 등 다양한 GPU를 적용한다.

'Vertical K-Scale'은 단일 클라우스 서비스업체에서 1000장 이상의 GPU를 하나의 클러스터로 구성해 극한의 성능과 확장성을 검증한다. 특히 GPUBASE의 핵심 기술인 다중경로 전송 기술의 효율성을 GPU 1000장 규모에서 공식 검증할 계획이다. 

아크릴은 향후 'Vertical K-Scale'에 대한 공인 시험기관 성적서 발급도 추진할 예정이다.

아크릴 관계자는 "이번 평가는 두 개의 축을 중심으로 클라우드 전반을 입체적으로 검증한다는 점에서 관련 생태계에 십자를 그리는 것을 의미한다"고 말했다.

이어 "Horizontal 축은 다양한 클라우드 환경을 가로지르고 Vertical축은 성능의 한계를 세로로 확장한 개념으로 두 축이 교차하는 지점에서 클라우드 종류와 규모에 관계없이 안정적으로 동작할 수 있음을 입증할 것"이라고 전했다.

아크릴은 이번 검증을 시작으로 상반기 중 Phase 1(GPU 1000장, 단일 클러스터)을 착수하고, 연내 Phase 2(GPU 3000장 이상)로 확대할 계획이다. 

GPUBASE는 아크릴이 독자 개발한 GPU 클러스터 최적화 소프트웨어로, 다중경로 전송, 트래픽 차등화(PeRF), GPU 동적 할당, 멀티벤더 GPU 통합 관리 등 4대 핵심 기술이 적용됐다.

26만대 규모의 GPU가 순차적으로 도입되면 국가 전략 AI 클러스터 구축을 목표로 하고 있는 국내 AI 전략의 실행에 힘입어 GPUBASE에 대한 업계의 관심은 더욱 더 커질 것이라고 회사 측은 설명했다.

박외진 아크릴 대표이사는 "전 세계 AI GPU 클러스터 네트워크 시장이 인피니벤드에서 이더넷 기반 RDMA 기술로 빠르게 전환되고 있는 가운데, 업계의 핵심 과제인 성능 간극 해소를 GPUBASE가 소프트웨어로 해결할 수 있을 것을 기대한다"고 강조했다.

또한 "이번 프로젝트를 통해 GPUBASE가 국가 규모 GPU 클러스터에서 안정적으로 동작할 수 있다는 점을 검증하겠다"고 덧붙였다.

Copyright ⓒ 프라임경제 무단 전재 및 재배포 금지
alert

댓글 쓰기 제목 아크릴, 글로벌 1·2위 美 클라우드기업과 GPU 최적화 기술 대규모 성능 검증 착수

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중