Cloud Hadoop

쉽고 빠른 빅데이터 처리/분석을 위한 Hadoop 클러스터를 제공하는 서비스

Samsung Cloud Platform은 빅데이터 처리 및 분석에 활용하는 Hadoop 클러스터를 제공합니다. Cloud Hadoop을 통해 소규모 컴퓨팅 자원을 활용하여 대용량 데이터의 클러스터링 및 병렬 처리가 가능합니다. 또한 Apache 오픈소스를 기반으로 상호 호환성이 검증된 Hadoop Ecosystem과 관리 환경을 제공하여 편리하게 사용할 수 있습니다

서비스 특징

01

04

서비스 구성도

  • Data Ingestion → Data Process/Analytics
    • Data Ingestion
      실시간 데이터수집(Kafka)
      정형/비정형 데이터수집(Sqoop, Flume)
    • Data Process/Analytics
      Data Processing: Map Reduce, Hive, Hue, Livy, Solr
      Execution Engine: Tez, Spark
      Data Operation: YARN
      Coordinator: Zookeeper
      Data Governance: Atlas
      Security: Ranger
      NoSQL DB: HBase
      Data Storage for Any Data Type: HDFS

주요 기능

  • 자동화된 Hadoop Cluster 제공

    - 상호 호환성이 검증된 Hadoop Ecosystem을 제공하며, 사용자에게 서버(VM)접속 허용
    - 초기 설치 항목 : Monitoring Server, Zookeeper, HDFS, YARN, HBase

  • 다양한 오픈소스 지원

    - HDFS, Zookeeper, YARN, Spark, Hive, TEZ, Atlas, Ranger, Livy, Hue, Kerberos, HBase, Solr

  • 사용자 편의 기능

    - Hadoop Ecosystem별 설치/관리 기능
    - Configuration 최적값 및 버전 관리 기능
    - 시스템 자원의 통합 모니터링을 위한 대시보드 제공
    - 서비스 장애 Alert 기능

요금 기준

    • 과금
    • 클러스터 구성 노드 VM Type의 시간 단위 과금 (VM + Hadoop 애플리케이션 비용)
무엇이든 물어보세요

비즈니스 성공에 필요한 핵심 기능을 제공하는 삼성SDS 클라우드를 살펴보고, 클라우드 전문가와 상담해보세요.