SK텔레콤은 최신 B200 GPU 기반의 GPUaaS(GPU-as-a-Service)를 출시했다고 5일 밝혔다. GPUaaS는 대규모 모델 학습 및 추론을 위한 GPU 클라우드 인프라 제공 서비스를 뜻한다.
이번에 선보인 GPUaaS는 1000장 이상의 엔비디아 최신 AI 칩 '블랙웰 B200'을 단일 클러스터로 구성한 서비스로, 국내에서 가장 큰 규모의 GPU 클러스터다. 이는 지난해 12월 출시된 H100 기반 GPUaaS보다 성능이 향상된 버전이다.
SK텔레콤은 서울 가산에 위치한 AI 데이터센터(이하 AI DC)에 B200 GPU 클러스터를 새로 구축함으로써, 국내 GPU 수급난 해소와 AI 인프라 확충을 동시에 추진하고 있다.
이번 클러스터의 명칭은 '해인(海印)'이다. 팔만대장경을 보관한 해인사에서 착안해, 방대한 디지털 정보를 처리하는 AI 인프라의 상징적 의미를 담았다.
이 GPUaaS는 과학기술정보통신부의 'AI-컴퓨팅 자원 활용 기반 강화(GPU 임차 지원) 사업'에 선정돼, 국가 AI 파운데이션 모델 개발을 위한 자원으로 활용될 예정이다. 해당 사업은 국내 AI 산업의 경쟁력 확보와 생태계 고도화를 목표로 한다.
SK텔레콤은 이번 GPUaaS 출시를 위해 미국 AI DC 솔루션 업체 펭귄 솔루션스(Penguin Solutions)와 협력했다. 펭귄 솔루션스는 엔비디아 인증 파트너로, 25년 이상 고성능 컴퓨팅(HPC) 설계 및 운영 경험을 보유하고 있다.
지난 7월, SK텔레콤은 펭귄 솔루션스와 2억 달러 규모의 투자 계획을 체결하고, 전담 태스크포스를 구성해 협업을 이어가고 있다. 또한, 글로벌 AI 서버 제조사 슈퍼마이크로와의 협력으로 B200 GPU 서버를 단기간 내 확보해 서비스 제공에 속도를 냈다.
GPU 클러스터 운영에는 SK텔레콤의 독자 기술도 적용됐다. 가상화 솔루션 '페타서스(Petasus) AI 클라우드'를 통해 GPU 자원을 유연하게 분할·재구성하고, AIOps(IT 운영을 위한 AI) 기반 관리 시스템인 'AI Cloud Manager'를 함께 제공해 작업 효율성과 사용자 편의성을 높였다.
이번 B200 기반 GPUaaS 출시는, 지난해 글로벌 AI 클라우드 기업 람다(Lambda)의 한국 리전 개소에 이은 인프라 확장 사례다. SK텔레콤은 앞으로도 GPUaaS 사업을 확대해, 국내 AI 산업이 글로벌 경쟁력을 확보할 수 있도록 기술 및 인프라 측면에서 지원을 이어갈 계획이다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성