AI시대, GPU를 서비스하다(GPUaaS)

AI시대, GPU를 서비스하다(GPUaaS)

몇 년 전, GPU(Graphic Process Unit)는 중앙 처리장치인 CPU(Central Process Unit)의 작은 부분이었습니다. CPU는 주요한 컴퓨팅 자원으로 활용되고, 장비들의 사양 발전에 따라 CPU도 막강한 사양으로 무장하여 사용자들의 요구를 충족했습니다. GPU는 이름에서도 알 수 있듯이 PC 또는 컴퓨터 그래픽 및 비디오를 활성화하는데 보조적인 역할로서 사용되었습니다. 그러나, 기술의 발전과 함께 컨텐츠는 사진, 오디오 및 비디오 등 다양한 멀티미디어로 확대되었고, 그로 인해 GPU의 역할이 더욱 중요해졌습니다. GPU는 수천 개의 스레드를 동시에 처리할 수 있는 수백 개의 코어로 구성된 특화된 마이크로프로세서로서, 병렬 처리 방식에 특화된 구조를 갖추고 있어 시간이 많이 걸리는 영상이나 렌더링을 비롯한 고성능 그래픽 작업이나 반복적이고 전문화된 컴퓨팅 작업을 빠르게 수행해 주었습니다. GPU는 게이머와 VR/AR의 틈새 시장에서 수요가 많았던 것에서 좀 더 대중적인 매력으로 꾸준히 확대되고 있습니다.[1]

CPU: Core가 순차적으로 하나씩 연산(1,2,3,4,5,6,7), GPU : 다수의 Core가 한 번에 병렬로 처리 (1,1,1,1,1,1,1) CPU와 GPU의 차이 (출처: EhostICT[2])

3D 모델링 및 애니메이션의 사용이 점점 더 많아짐에 따라 GPU 솔루션의 고성능 컴퓨팅 기능에 대한 수요가 높아지고 있으며, 애니메이션 스튜디오는 현재 애니메이션 장편 영화의 품질을 향상시키기 위해 GPU 솔루션을 제공하는 회사와 협력하고 있습니다. 또한, 업종 전반에 있어 딥러닝, 인공지능(AI) 및 빅데이터 분석으로 뒷받침되는 제품 설계, 개발, 데이터 분석을 위해 IoT와 산업 사물인터넷(IIoT)을 빠르게 채택하기 위해서도 프로세스 확장과 속도를 높이기 위한 고성능 GPU가 필요합니다. [1]

그러나, 대부분의 기업이 GPU 인프라를 온프레미스로 설정하는 것은 어려운 일입니다. 최적의 사용을 위해 GPU 인프라 수요를 예측하고 계획하는 것 또한 매우 어렵습니다. 이것이 바로 GPUaaS(GPU-as-a-Service)가 등장한 이유이고, 대부분의 비즈니스에서 적용이 가능합니다. GPUaaS는 기본적으로 GPU 인프라를 주문형으로 탄력적 프로비저닝하기 위한 것입니다. 저비용 영향, 클라우드 서비스 제공업체의 지원과 온디멘드 확장성은 GPUaaS의 주요 이점이라 할 수 있습니다.

GPUaaS 시장, 연 38% 이상의 성장

전 세계적으로 클라우드 컴퓨팅으로의 이동이 증가함에 따라 GPUaaS 시장이 더욱 촉진되고 있습니다. 비디오 편집, 그래픽 디자인 및 이미지 처리에 사용되는 여러 그래픽 응용 프로그램에는 일반적으로 업그레이드된 GPU가 장착된 고성능 컴퓨터가 필요하고, GPUaaS의 등장으로 고급 GPU를 구입할 필요 없이 클라우드 기술을 활용하여 SaaS, IaaS 및 PaaS 형태로 GPU의 처리 능력을 사용할 수 있게 되었습니다. [3]

Global Market Insights에 따르면, GPUaaS의 시장은 2019년에서 2025년까지 CAGR 38% 이상으로 성장하여 70억 달러 규모를 초과할 것으로 예상됩니다. 암호화 화폐 채굴의 급격한 증가와 다양한 지역의 클라우드 게임 시장의 급증으로 인해 2019년에서 2025년 사이에 가속화된 성장이 예상됩니다. 부동산 부문에서 인프라를 3D 애니메이션으로 표현하고 투자자와 고객을 유치하기 위한 3D 렌더링과 건축 디자인 서비스에 대한 수요 증가는 시장 성장을 뒷받침하고 있습니다. 기업의 제품 개발을 위한 시각 효과의 필요성이 증가함에 따라, CAD(Computer-aided Design) 및 CAM(Computer-aided Manufacturing)을 위한 GPUaaS 수요 역시, 제조에서 자동차 산업에 까지 다양하게 확대될 것입니다. 또한, 딥러닝과 빅데이터와 같은 기술의 급증하는 확산도 시장 성장을 뒷받침할 것입니다. 여러 산업 분야에 걸친 지속적인 디지털화의 결과로 데이터센터의 수가 증가함에 따라 예측 분석 도구의 채택이 필요하게 되었고, 데이터 분석 및 예측 분석을 사용한 환경 모델링, 분자 및 생명 공학 분석 등에 대한 요구가 증가함에 따라 시장이 성장할 것입니다. [4]

다양한 산업 영역 중에서 게임 산업은 GPUaaS 시장을 상당히 견인할 것으로 예상됩니다. 스마트 장치의 확산과 함께 증가하는 인터넷 보급률은 전 세계적으로 온라인 게임 사용자의 수를 증가시키고 있으며, 클라우드 게임은 강력한 게임용 PC가 없는 게이머에게 끊김 없는 고화질 게임 경험을 제공하게 될 것입니다. 시간당 지불 구독을 통해 더 많은 게이머를 창출하고 불법 복제를 줄이며 수익 창출을 증가시킴으로써 게임 개발자에게 이익이 될 것입니다. 게임 외에 제조, 디자인/제조, 자동차, 헬스케어, 부동산, 교육 등의 산업에서 GPUaaS의 시장은 성장할 것으로 예측됩니다. [4]

  • Gaming : 2018: $70M, 2025: $650M
  • Design & manufacturing : 2018: $50M, 2025: $300M
  • Automotive : 2018: $60M, 2025: $279.8M
  • Real-estate : 2018: $20M, 2025: $100M
  • Healthcare : 2018: $30M, 2025: $200M
  • Others : 2018: $10M, 2025: $70M
U.S. GPUaaS Market Revenue, By Application, 2018 ~ 2025 (출처: gminsights[4])

GPUaaS는 클라우드 서비스 업체와 GPU 업체에서 지원하고 있으며, GPUaaS 시장은 이들 두 업체 간의 지속적인 협력을 통해 더욱 성장할 것입니다. Microsoft 및 Amazon과 같은 글로벌 클라우드 서비스 제공업체는 다양한 딥러닝 서비스를 향상시키기 위해 NVIDIA 및 Intel을 포함한 GPU 제공업체와 파트너 관계를 맺고 있으며, 그 예로 Amazon Web Services는 딥러닝 알고리즘을 기반으로 하고 Intel GPU로 구동되는 AWS DeepLens AI Dev Kit을 발표하기도 했습니다. [3]

클라우드 게임 시장을 견인하는 GPUaaS

클라우드에서 스트리밍되는 영화, TV프로그램, 음악 등의 엔터테인먼트 콘텐츠는 지난 10년 동안 일상 생활의 일부가 되었고, 넷플릭스, 아마존, Spotify, SoundCloud와 같은 업체들 모두 해당 시기에 두각을 나타냈습니다. 컴퓨터 게임 스트리밍은 개념 자체를 확립하는데 좀 더 오랜 시간이 걸렸지만, 전문 분석가들은 세계 클라우드 게임 시장이 2019년에서 2025년 사이에 42% 성장할 것으로 전망하고 있습니다.[5]

여러 대형 클라우드 서비스 제공업체들과 통신업체들은 직접 클라우드 게임을 제공하거나, 이 시장의 주요 업체들을 위한 서비스와 오퍼링을 출시하려는 계획을 통해 사용자들이 노트북, 태블릿, TV, 휴대전화와 같은 장치에서 고급 게임을 스트리밍합니다. 이를 통해, 게이머들은 프리미엄 타이틀 게임을 하기 위해 정기적으로 PC 하드웨어나 콘솔의 업그레이드가 불필요하고 게임 개발자들이 사용자에 대한 걱정 없이 게임에 대한 업데이트가 가능하게 됨으로써 게이머들의 참여를 증가시킬 수 있는 잠재력을 가지게 되었습니다.

디지털 게임 수요와 함께 게임 기기의 다양성이 증가함에 따라, 클라우드 게임의 구현은 불가피한 선택이었습니다. 끊임없이 진화하는 디지털 게임 산업은 데스크탑, 워크스테이션, 모바일 및 게임 콘솔과 그래픽 처리 장치의 통합으로 엄청난 활력을 얻었으며[3], 지난 몇 년 동안 증강현실(AR)과 가상현실(VR) 장치가 게임 경험을 향상시키게 됨에 따라 점점 더 큰 인기를 얻게 되었습니다. 이는, 결과적으로 게임을 뒷받침하는 클라우드 인프라에 더 큰 부담이 되고, 결국 AR과 VR 모두 대기 시간에 민감하여 차세대 게임에서는 고급 CPU도 처리할 수 없는 연산 성능을 요구하게 됩니다. 시각적 콘텐츠를 향상시키고 실시간에 가까운 그래픽 집약적인 게임을 스트리밍하려면 상당한 양의 대역폭과 안정적인 인터넷 연결이 필요하고, 이러한 하드웨어 기능에 대한 수요를 처리하기 위해 클라우드 게임 서비스는 GPUaaS를 채택했습니다. GPUaaS 사용으로 수백 개의 그래픽 집약적인 게임을 높은 프레임 속도로 동시에 스트리밍할 수 있어 지연 시간을 줄일 수 있게 됩니다.
Global Market Insights의 연구 보고서에 따르면, 아시아 태평양 GPUaaS 시장은 2019년에서 2025년 사이에 40% 이상의 CAGR로 가장 빠른 성장이 예상됩니다. 아시아 태평양 지역은 게임 시장의 핵심 기여자로 GPUaaS 기반의 클라우드 게임을 빠르게 채택하여 산업 성장을 이끌고 있습니다. [1]

AI 시대의 필수요소 고성능 GPUaaS

오늘날의 컴퓨팅 집약적 비즈니스 환경에서 데이터를 활용하는 능력은 비즈니스 성공의 핵심 지표입니다. 기업에서 AI 채택이 증가함에 따라, 머신러닝(ML), 딥러닝(DL) 및 데이터 분석이 제기하는 문제를 해결할 수 있는 컴퓨팅 및 스토리지 성능이 필요해졌습니다. 기업이 AI 혁신을 시작함에 있어 가장 일반적인 인프라 선택 중 하나는 머신러닝 및 딥러닝에 GPU를 사용하는 것입니다. GPU 데이터 처리의 잠재력은 여러 산업에 걸친 프로세스 집약적인 운영에 있어 사실상 무한하다고 할 수 있습니다. GPU에서 사용할 수 있는 방대한 컴퓨팅 성능을 통해 기업은 대규모 데이터 셋에서 매우 유용하고 가치 있는 비즈니스 인텔리전스를 놀라운 정확성과 속도로 얻을 수 있습니다. GPU를 통해 전체 데이터 셋을 수용하므로 사용자는 즉시 수십억 줄에 걸친 데이터 워크플로우를 시각화, 쿼리 및 실행할 수 있으며, 고객은 엄청난 양의 데이터에서 패턴과 통찰력을 즉시 찾아낼 수 있게 됩니다. [6] 그러나, 많은 엔터프라이즈 기업은 다양한 AI 애플리케이션 및 사용사례를 위한 여러 데이터 사이언티스트 팀의 GPU에 대한 수요를 충족하는 것이 어려울 수 있습니다. 일반적으로, 기업은 단일 애플리케이션 전용 GPU 서버를 프로비저닝 및 배포하기 때문에 서로 다른 팀은 차례가 올 때까지 대기해야만 했습니다.

그러나, GPUaaS(GPU-as-a-Service)는 GPU 가속 애플리케이션에 대한 주문형 및 탄력적 프로비저닝을 제공하는 동시에 여러 애플리케이션에 GPU 인프라 리소스를 공유하고 할당합니다. 즉, 여러 서버의 GPU 풀을 여러 머신러닝/딥러닝 응용 프로그램에 걸쳐 통합하고 공유할 수 있으며, 각 응용프로그램에는 적절한 수의 GPU가 할당됩니다. 또한, 개발자가 딥러닝 교육과 예측 모델에 대한 실험과 배포를 보다 쉽게 수행할 수 있도록 하여, 딥러닝 애플리케이션을 가속화하고 단순화할 수 있습니다. 엄청난 양의 데이터와 실시간 분석에 대한 수요 증가로 고성능 컴퓨팅의 기술은 더욱 성장할 것이며, 자율 주행 자동차에서 양자 컴퓨팅에 이르기까지 AI는 비할 데 없는 컴퓨팅 기능을 가능하게 하고 많은 인지 작업에서 인간을 능가할 것으로 예상됩니다. 글로벌 기업들은 이러한 AI 애플리케이션(자율주행 자동차와 양자 컴퓨팅을 지원하는 애플리케이션)을 GPU와 통합하여 많은 고객을 유치하고 있습니다. 예를 들어, NVIDIA는 고성능 다중 GPU와 딥러닝 알고리즘을 통합 제공하는 NVIDIA 딥러닝 SDK를 출시하여, 통합 솔루션으로 구동되는 고밀도 GPU 환경을 생성하고 자동화된 실시간 인텔리전스와 통찰력을 제공하였습니다. [4]

VMware 경우, 2020년 AI 및 머신러닝 애플리케이션에 필요한 인프라를 온디맨드 형식으로 지원하는 VMware v스피어 비트퓨전을 발표했습니다. AI 및 머신러닝 기반 애플리케이션 중에서 특히 딥러닝 학습을 요하는 애플리케이션은 방대하고 복잡한 처리를 위해 GPU와 같은 하드웨어 가속기에 의존하며, 이를 위해 기업이 GPU 리소스를 서버에 할당하고 데이터센터 내에서 공유할 수 있도록 지원한다고 설명합니다. [7] Duke University는 학생과 연구원의 AI와 머신러닝 실행을 위한 GPU 리소스가 필요했고, 제한된 GPU풀과 대규모 사용자 풀을 조정하는 문제에 있어서 VMware의 v스피어 비트퓨전을 사용하여 GPUaaS(GPU-as-a-Service) 환경을 구축하고 연결된 풀에서 GPU 사용률을 공유하고 활용률을 높여 다양한 시간에 다양한 요구사항과 우선순위를 충족시켰습니다. [8] 삼성SDS도 AI 연구개발용 GPU 클러스터링 기술을 활용한 R&D Cloud for AI를 제공하고 있습니다. 고성능 GPU를 클러스터링을 통해 하나로 통합하여 전체 가용량을 늘리고, 클러스터링 된 자원에 분배 기술을 적용하여 필요한 사용자가 필요한 시점에 필요한 만큼 효과적으로 활용할 수 있도록 제공합니다. 또한, 사용자가 원하는 환경을 가상화된 컨테이너로 제공하여 AI 개발환경 세팅에 드는 시간을 줄이고 AI 연구 자체에 집중할 수 있으며, AI 연구에 특화된 스케쥴러를 통해 Job의 순서와 배치를 조정하여 자원 활용 효율성을 극대화할 수 있습니다. [9]

  • 개인화 컨테이너 : Tensorflow, Pandas, Anaconda
  • 개인화 컨테이너 : PyTorch, Numpy, Beautifulsoup
  • 개인화 컨테이너 : Tensorflow, Pandas, Beautifulsoup
R&D Cloud for AI에서 제공하는 개인화된 컨테이너 예시 (출처: 삼성SDS[9])

병렬 연산에 특화된 GPU는 AI 연구개발을 가속화하는데 핵심 요소가 분명합니다. 참고로, 시장 조사업체 리프터(Liftr)는 2019.5월에 아마존 웹 서비스(AWS), 마이크로소프트 애저, 구글 클라우드, 알리바바 등 글로벌 4대 클라우드 데이터센터에서 사용하는 AI 가속기의 97.4%가 엔비디아 GPU라는 조사결과를 발표한 바 있습니다. [10]

[표 1] 자바EE와 자카르타EE 용어 비교
Company Accelerator March 2019 April 2019 May 2019
Nvidia GPU 97.0% 97.3% 97.4%
AMD GPU 1.2% 1.1% 1.0%
Xilinx FPGA 1.1% 1.0% 1.0%
Intel FPGA 0.6% 0.6% 0.6%
Intel FPGA 0.6% 0.6% 0.6%
Total Types All 1,852 1,990 2,003
Source : Liftr Cloud Insights, June,2019

4대 클라우드 기업에 사용되는 AI가속기 비율 (출처: 리프터, 2019)

GPUaaS의 미래

GPUaaS 시장은 NVIDIA, AMD, Intel과 같은 저명한 GPU 글로벌 플레이어로 인해 고도로 집중된 시장입니다. 이들은 주요 시장 점유율과 광범위한 글로벌 입지를 갖추고 있으며, IBM, Microsoft, Google 및 Amazon과 같은 주요 클라우드 서비스 업체와 협력하여 가상현실(VR)과 증강현실(AR) 기술을 포함한 클라우드 게임 경험을 제공하고, 시장 성장을 확대하기 위해 기술 혁신 및 개발에 집중하고 있습니다. [4]

AI 시대가 개막되면서 방대한 데이터를 정해진 수식으로 처리하는 딥러닝 분야가 활발해짐에 따라 병렬처리에 특화된 GPU가 더욱 빛을 발하게 되었습니다. GPUaaS를 통해 원격 위치에서 강력한 GPU 기능에 대한 엑세스를 제공하여 고급 GPU를 구입할 필요 없이 클라우드 기술을 활용하여 GPU의 처리 능력을 사용할 수 있습니다. 이러한 서비스는 구독당 지불하는 방식으로 비용 효율적이고, 사용자의 워크로드에 따라 동적 가격 범위에서 다양하게 선택할 수 있습니다. [3] GPUaaS를 통해 몇 주, 몇 달이 아닌 몇 시간, 며칠 단위로 머신러닝과 AI 작업 속도를 높여 작업 완료 시간을 단축할 수 있으며, GPU로 구동되는 AI를 이용하여 직원 승인, 결제 처리, 판매 할인 등의 프로세스를 자동화하거나 당뇨병으로 인한 실명의 조기 징후를 감지하기 위해 다국어 AI 음성 엔진을 훈련하는 것과 같은 다양한 작업에 활용할 수 있습니다. [1] GPUaaS는 클라우드 및 AI 애플리케이션에서 더욱 중요해질 것이며, CAD, 모델링, 시뮬레이션, 3D 애니메이션 등의 사용을 기반으로 지속적으로 성장할 것입니다.


References
[1] https://www.pcquest.com/rise-gpu-service/
[2] https://blog.naver.com/ehostidc2004/222468336074
[3] https://www.missioncriticalmagazine.com/articles/93597-gpu-as-a-service-market-projected-to-reach-7-billion-by-2025
[4] https://www.gminsights.com/industry-analysis/gpu-as-a-service-market
[5] https://blog.naver.com/ki630808/221893678884
[6] https://www.brytlyt.com/insight/gpu-vs-cpu/
[7] https://www.ciokorea.com/news/154324
[8] https://myevents.VMware.com/widget/VMware/vmworld2021/catalog?search=1987
[9] https://www.samsungsds.com/kr/insights/TechToolkit_2021_GPU.html?moreCnt=1&backTypeId=insight&category=all
[10] http://www.aitimes.com/news/articleView.html?idxno=131512
[11] https://community.hpe.com/t5/Tech-Insights/HPE-enables-GPU-as-a-Service-for-enterprise-AI-deployments/ba-p/7050169
[12] https://m.blog.naver.com/daara2004/221758797825
[13] https://www.notebookcheck.net/The-GPU-as-a-Service-market-is-projected-to-grow-to-10x-its-current-value-by-2025.427186.0.html
[14] https://www.iguazio.com/solutions/gpu-as-a-service/
[15] https://cloudplatform.googleblog.com/2018/06/GPUs-as-a-service-with-Kubernetes-Engine-are-now-generally-available.html
[16] https://www.cio.com/article/3561090/giving-your-data-scientists-a-boost-with-gpuaas.html



▶  해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶  해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.


이 글이 좋으셨다면 구독&좋아요

여러분의 “구독”과 “좋아요”는
저자에게 큰 힘이 됩니다.

subscribe

홍은주
홍은주

삼성SDS 전략마케팅팀

IT 동향 분석, 프로세스 혁신 및 경영전략 수립의 컨설팅 업무 경험을 기반으로, 삼성SDS 닷컴 내 Digital Transformation 및 솔루션 페이지 기획/운영 업무를 수행하였고 SDS 주요 사업영역별 동향/솔루션 분석을 통한 컨텐츠 기획 및 마케팅을 수행하고 있습니다.