Multi-node GPU Cluster (멀티 노드 GPU 클러스터)

대규모 고성능 AI 연산을 위한 다량의 GPU 제공 서비스

멀티 노드 GPU 클러스터는 대규모의 고성능 AI 연산을 위해 물리 GPU 서버를 가상화 없이 제공하는 서비스입니다. GPU 가 장착된 베어 메탈 서버 2대 이상을 사용하여 다수의 GPU를 클러스터링 할 수 있으며, 삼성 클라우드 플랫폼 (Samsung Cloud Platform, SCP)의 고성능 스토리지 및 네트워킹 상품과 연계하여 편리하게 GPU 서버를 사용할 수 있습니다.

멀티 노드 GPU 클러스터 서비스 특징

01

04

멀티 노드 GPU 클러스터 서비스 구성도

사용자- 인터넷 - Multi-node GPU Cluster Multi-node GPU Cluster
Bare Metal Server GPU GPU GPU GPU GPU CPU
NVSwitch
900GB/s (H100)
600GB/s (A100)
InfiniBand Switch HCA ← GPU Direct RDMA 구간 → HCA (우측 Bare Metal Server)
Bare Metal Server CPU GPU GPU GPU GPU GPU
NVSwitch
900GB/s (H100)
600GB/s (A100)
Block Storage(BM) : Ethernet 25Gbps AFA NAS Storage (Bare Metal Server 구간) 고성능 스토리지 : Ethernet 100Gbps (Bare Metal Server 구간) AFA NAS Storage (A100, H100) (Bare Metal Server 구간) Object Storage(BM) : Ethernet 25Gbps

멀티 노드 GPU 클러스터 주요 기능

  • GPU 베어 메탈 서버 생성/관리
    1. NVIDIA GPU 8장을 장착한 표준 GPU 베어 메탈 서버 제공
      ※ Internal NVMe Disk, NVIDIA NVSwitch, NVIDIA NVLink
    2. RDMA SW Stack의 OS 표준 이미지 제공 (OS : Ubuntu)
  • 고성능 처리
    1. InfiniBand 스위치를 이용하여 GPU Direct RDMA 환경 구성
    2. 고성능 SSD 파일 스토리지 제공 (A100, H100)
      ※ AFA 파일 스토리지 100Gbps Ethernet 연결
  • 스토리지 및 네트워크 연동
    1. OS 디스크 외 추가 연결 스토리지 (블록, 오브젝트) 제공
    2. 서브넷/IP 및 VPC Firewall 연계 설정

멀티 노드 GPU 클러스터 요금 기준

    • 과금
    • 무약정 : 자원 신청 후 할당 시간 기준 시간 단위 과금
    • 약정: 1년/3년 약정 조건에 따른 할인 적용. 신청 자원 기준 월 단위 정액 과금
        ※ 약정 기간 내 해지 시 위약금 발생
무엇이든 물어보세요

비즈니스 성공에 필요한 핵심 기능을 제공하는 삼성SDS 클라우드를 살펴보고, 클라우드 전문가와 상담해 보세요.

공유하기