Cloud Hadoop (클라우드 하둡)

쉽고 빠른 빅데이터 처리/분석을 위한 하둡 클러스터를 제공하는 서비스

삼성 클라우드 플랫폼 (Samsung Cloud Platform, SCP)은 빅데이터 처리 및 분석에 활용하는 하둡 클러스터를 제공합니다. 클라우드 하둡을 통해 소규모 컴퓨팅 자원을 활용하여 대용량 데이터의 클러스터링 및 병렬 처리가 가능합니다. 또한 아파치 오픈소스를 기반으로 상호 호환성이 검증된 하둡 에코 시스템과 관리 환경을 제공하여 편리하게 사용할 수 있습니다

클라우드 하둡 서비스 특징

01

04

클라우드 하둡 서비스 구성도

  • Data Ingestion → Data Process/Analytics
    • Data Ingestion
      실시간 데이터수집(Kafka)
      정형/비정형 데이터수집(Sqoop, Flume)
    • Data Process/Analytics
      Data Processing: Map Reduce, Hive, Hue, Livy, Solr
      Execution Engine: Tez, Spark
      Data Operation: YARN
      Coordinator: Zookeeper
      Data Governance: Atlas
      Security: Ranger
      NoSQL DB: HBase
      Data Storage for Any Data Type: HDFS

클라우드 하둡 주요 기능

  • 자동화된 하둡 클러스터 제공

    - 상호 호환성이 검증된 하둡 에코 시스템을 제공하며, 사용자에게 서버(VM) 접속 허용
    - 초기 설치 항목 : HDFS, YARN, HBASE, HIVE, TES, Hue, Solr, Spark, LIVY

  • 다양한 오픈소스 지원

    - HDFS, ZooKeeper, YARN, Spark, HIVE, TEZ, Atlas, Ranger, LIVY, Hue, KERBEROD, HBASE, Solr, Kafka, Flume, Sqoop, Oozie, Kudu, Impala

  • 사용자 편의 기능

    - 하둡 에코시스템 별 설치/관리 기능
    - Configuration 최적값 및 버전 관리 기능
    - 시스템 자원의 통합 모니터링을 위한 대시보드 제공
    - 서비스 진단을 통한 장애 Alert 기능

클라우드 하둡 요금 기준

    • 과금
    • 클러스터 구성 노드 VM Type의 시간 단위 과금 (VM + Hadoop 애플리케이션 비용)
무엇이든 물어보세요

비즈니스 성공에 필요한 핵심 기능을 제공하는 삼성SDS 클라우드를 살펴보고, 클라우드 전문가와 상담해 보세요.

공유하기