Multi-node GPU Cluster (멀티 노드 GPU 클러스터)

대규모 고성능 AI 연산을 위한 다량의 GPU 제공 서비스

멀티 노드 GPU 클러스터는 대규모의 고성능 AI 연산을 위해 물리 GPU 서버를 가상화 없이 제공하는 서비스입니다. GPU 가 장착된 베어 메탈 서버 2대 이상을 사용하여 다수의 GPU를 클러스터링 할 수 있으며, 삼성 클라우드 플랫폼 (Samsung Cloud Platform, SCP)의 고성능 스토리지 및 네트워킹 상품과 연계하여 편리하게 GPU 서버를 사용할 수 있습니다.

멀티 노드 GPU 클러스터 서비스 특징

손쉬운 GPU 아키텍처 구성
삼성 클라우드 플랫폼 (Samsung Cloud Platform, SCP)의 멀티 노드 GPU 클러스터는 고성능 NVIDIA SuperPOD 아키텍처를 적용한 베어 메탈 서버를 제공하여, GPU를 활용한 다수의 사용자 또는 대규모 AI 모델 학습의 고성능 분산 워크로드 처리가 가능합니다.
고성능 네트워크 연계
멀티 노드 GPU 클러스터는 삼성 클라우드 플랫폼 (Samsung Cloud Platform, SCP)의 네트워크 자원과 연동하여 고성능이 필요한 AI Job을 수행할 수 있습니다. InfiniBand 스위치를 이용하여 GPU Direct RDMA (Remote Direct Memory Access) 환경을 구성함으로써 GPU 메모리간 데이터 IO를 직접 처리하여 AI/머신 러닝 고속 연산이 가능합니다.
고성능 스토리지 연계
멀티 노드 GPU 클러스터는 삼성 클라우드 플랫폼(Samsung Cloud Platform, SCP)의 다양한 스토리지 자원과 연계하여 사용할 수 있습니다. 고속 네트워크와 직접 연동한 고성능 SSD 파일 스토리지와 NVMe 병렬 파일시스템 스토리지를 사용 가능하며, 블록 스토리지 및 오브젝트 스토리지도 연계하여 사용 가능합니다.

01

04

멀티 노드 GPU 클러스터 서비스 구성도

멀티 노드 GPU 클러스터 주요 기능

GPU 베어 메탈 서버 생성/관리
1. NVIDIA GPU 8장을 장착한 표준 GPU 베어 메탈 서버 제공(B300, H100)
  ※ Internal NVMe Disk, NVIDIA NVSwitch, NVIDIA NVLink
2. RDMA SW Stack의 OS 표준 이미지 제공 (OS : Ubuntu)
고성능 처리
1. InfiniBand 스위치를 이용하여 GPU Direct RDMA 환경 구성
2. 고성능 SSD 파일 스토리지 제공
3. NVMe Parallel File Storage 제공
스토리지 및 네트워크 연동
1. OS 디스크 외 추가 연결 스토리지 (Block, Object, File) 제공
2. 서브넷/IP 및 VPC Firewall 연계 설정

무엇이든 물어보세요

비즈니스 성공에 필요한 핵심 기능을 제공하는 삼성SDS 클라우드를 살펴보고, 클라우드 전문가와 상담해 보세요.