SK텔레콤, 최신 GPU 클러스터 ‘해인’ 가동

메트로신문 김서현 기자 ㅣ2025-08-05 11:50:25

SK브로드밴드 가산 AI DC에 구축된 B200 클러스터 '해인'의 모습 /SKT

SK텔레콤은 최신 B200 GPU 기반의 GPUaaS(GPU-as-a-Service)를 출시했다고 5일 밝혔다. GPUaaS는 대규모 모델 학습 및 추론을 위한 GPU 클라우드 인프라 제공 서비스를 뜻한다.

이번에 선보인 GPUaaS는 1000장 이상의 엔비디아 최신 AI 칩 '블랙웰 B200'을 단일 클러스터로 구성한 서비스로, 국내에서 가장 큰 규모의 GPU 클러스터다. 이는 지난해 12월 출시된 H100 기반 GPUaaS보다 성능이 향상된 버전이다.

SK텔레콤은 서울 가산에 위치한 AI 데이터센터(이하 AI DC)에 B200 GPU 클러스터를 새로 구축함으로써, 국내 GPU 수급난 해소와 AI 인프라 확충을 동시에 추진하고 있다.

이번 클러스터의 명칭은 '해인(海印)'이다. 팔만대장경을 보관한 해인사에서 착안해, 방대한 디지털 정보를 처리하는 AI 인프라의 상징적 의미를 담았다.

이 GPUaaS는 과학기술정보통신부의 'AI-컴퓨팅 자원 활용 기반 강화(GPU 임차 지원) 사업'에 선정돼, 국가 AI 파운데이션 모델 개발을 위한 자원으로 활용될 예정이다. 해당 사업은 국내 AI 산업의 경쟁력 확보와 생태계 고도화를 목표로 한다.

SK텔레콤은 이번 GPUaaS 출시를 위해 미국 AI DC 솔루션 업체 펭귄 솔루션스(Penguin Solutions)와 협력했다. 펭귄 솔루션스는 엔비디아 인증 파트너로, 25년 이상 고성능 컴퓨팅(HPC) 설계 및 운영 경험을 보유하고 있다.

지난 7월, SK텔레콤은 펭귄 솔루션스와 2억 달러 규모의 투자 계획을 체결하고, 전담 태스크포스를 구성해 협업을 이어가고 있다. 또한, 글로벌 AI 서버 제조사 슈퍼마이크로와의 협력으로 B200 GPU 서버를 단기간 내 확보해 서비스 제공에 속도를 냈다.

GPU 클러스터 운영에는 SK텔레콤의 독자 기술도 적용됐다. 가상화 솔루션 '페타서스(Petasus) AI 클라우드'를 통해 GPU 자원을 유연하게 분할·재구성하고, AIOps(IT 운영을 위한 AI) 기반 관리 시스템인 'AI Cloud Manager'를 함께 제공해 작업 효율성과 사용자 편의성을 높였다.

이번 B200 기반 GPUaaS 출시는, 지난해 글로벌 AI 클라우드 기업 람다(Lambda)의 한국 리전 개소에 이은 인프라 확장 사례다. SK텔레콤은 앞으로도 GPUaaS 사업을 확대해, 국내 AI 산업이 글로벌 경쟁력을 확보할 수 있도록 기술 및 인프라 측면에서 지원을 이어갈 계획이다.