AI&MLOps Platform
(AI&MLOps 플랫폼)

쿠버네티스 기반의 머신 러닝 플랫폼

AI&MLOps 플랫폼은 머신 러닝 모델의 개발, 학습, 배포 과정 전체 파이프라인의 반복적인 작업을 자동화하는 머신 러닝 플랫폼입니다.
Kubernetes 기반의 AI/MLOps1 환경을 제공하며, 학습 데이터와 모델, 운영 데이터의 통합적인 관리가 가능합니다.
1) MLOps: Machine Learning Development(Dev)와 Machine Learning System Operation(Ops) 통합을 목표로 하는 ML 엔지니어링 방법론

AI&MLOps 플랫폼 서비스 특징

01

04

AI&MLOps 플랫폼 서비스 구성도

  1. 사용자
  2. Console
  3. Kubernetes Engine : CPU Worker Nodes, GPU Worker Nodes, Persistent Volume
  1. Data Scientist, MLOps Engineer
  2. AI&MLOps Platform : Pipeline, Meta data, Model Serving, Notebook, Hyper Parameter Tuning ...
  3. Jupyter Notebook → Model Development → Model Training → Hyper Para.Tuning → Model Serving → Inference Application.

AI&MLOps 플랫폼 주요 기능

  • 기본 기능

    - AI 플랫폼 생성 (자동 배포/구성) , 조회 (플랫폼 버전, 자원 현황), 삭제
    - Jupyter Notebook 제공 : 모델 개발, 학습, 추론
    - 머신 러닝 Pipeline Workflow 자동화

  • 추가 기능(AI&MLOps Platform에서 가능)

    - Advanced AI/ML 플랫폼 대시보드
    - AI/ML Notebook Server : Base 이미지, 사용자 정의 이미지
    - AI/ML Job : Job 생성, 템플릿, 아카이브, 스케줄링, 실행, 모니터링
      · GPU 자원 모니터링, GPU Fraction 지원
      · Large Language Model 학습 (DeepSpeed) 지원을 위한 Job Operator 제공
    - 사용자 이미지 빌드 및 관리
    - AI JumpStarter 및 실험 추적 관리 (ETM : Experiment Tracking Management)
    - Serving : 대시보드, 모델 등록/관리, Inferencing, Predictions 시각화
    - 플랫폼 자원 관리 : 어카운트별 자원 사용량 관리, 자원 사용량 모니터링
    - 어카운트 사용자/권한 관리, Admin 기능, 플랫폼 Configuration 조정 기능

무엇이든 물어보세요

비즈니스 성공에 필요한 핵심 기능을 제공하는 삼성SDS 클라우드를 살펴보고, 클라우드 전문가와 상담해 보세요.