Kubeflow

Kubernetes 기반의 오픈소스 Machine Learning 플랫폼

Kubeflow는 머신러닝 모델의 개발, 학습, 배포 과정 전체 파이프라인의 반복적인 작업을 자동화하는 오픈소스 Machine Learning 플랫폼입니다. Kubernetes 기반의 MLOps1) 환경을 제공하며, 학습 데이터와 모델, 운영 데이터의 통합적인 관리가 가능합니다.
1) MLOps : Machine Learning Development(Dev)와 Machine Learning System Operation(Ops) 통합을 목표로 하는 ML 엔지니어링 방법론

서비스 특징

01

04

서비스 구성도

  1. 사용자
  2. Console
  3. Kubernetes Engine : CPU Worker Nodes, GPU Worker Nodes, Persistent Volume
  1. Data Scientist, MLOps Engineer
  2. Kubeflow : Pipeline, Meta data, Model Serving, Notebook, Hyper Parameter Tuning ...
  3. Jupyter Notebook → Model Development → Model Training → Hyper Para.Tuning → Model Serving → Inference Application.

주요 기능

  • Kubeflow 서비스 생성

    - 신청
      . 사용자가 지정한 Kubernetes 클러스터 대상으로 Kubeflow 자동배포 및 서비스 구성
    - 조회
      . 상품 목록, Kubeflow 버전, 자원 현황, Running/Stop 상태 정보 제공
    - 삭제
      . 생성한 KubeFlow 모듈 삭제

  • Kubeflow 서비스 기능

    - 기본 제공 기능
      . Jupyter Notebook 제공 (모델 개발, 학습, 추론)
      . Workflow 자동화 (Machine Learning Pipeline 기반)
    - Samsung Cloud Platform 추가 제공 기능
      . GPU Job Scheduling
      . ML Framework 이미지 (Tensorflow, PyTorch, Mxnet 등)
      . Kubeflow 엔진 모니터링/로깅, 인증 연동

요금 기준

    • 제공 항목
    • Kubeflow SW 패키징
    • 제공된 Kubeflow 외 오픈소소를 활용한 환경 구성은 사용자가 필요 항목 구성
    • 과금
    • 배포된 Kubeflow 규모와 사용 시간에 대해 시간 단위 과금
    • Kubeflow 패키지 외 구성 요소 비용 별도
        . Worker Node용 CPU VM, GPU VM
        . 사용자 VPC 환경 구성을 위한 VPC, Load Balancer, Security Group
        . PV 구성을 위한 Storage
        . Kubernetes Engine
무엇이든 물어보세요

비즈니스 성공에 필요한 핵심 기능을 제공하는 삼성SDS 클라우드를 살펴보고, 클라우드 전문가와 상담해보세요.