컴퓨터의 핵심 부품이 무엇인지 묻는다면, 대표적으로 CPU와 GPU를 떠올릴 수 있습니다. 그중에서 GPU(Graphics Processing Unit)는 중앙 처리장치인 CPU(Central Processing Unit)의 작은 부분이었습니다. CPU는 주요한 컴퓨팅 자원으로 활용되고, 장비들의 사양 발전에 따라 CPU도 막강한 사양으로 무장하여 사용자들의 요구를 충족해왔죠. 반면 GPU는 그 이름에서도 알 수 있듯이 PC 또는 컴퓨터 그래픽 및 비디오를 활성화하는데 보조적인 역할로 사용되었습니다.
그러나 기술의 발전과 함께 콘텐츠는 사진, 오디오 및 비디오 등 다양한 멀티미디어로 확대되었고, 그로 인해 GPU의 역할이 점차 중요해졌습니다. GPU는 수천 개의 스레드를 동시에 처리할 수 있는 수백 개의 코어로 구성된 마이크로프로세서로서, 병렬 처리 방식에 특화된 구조를 갖추고 있습니다. 이는 시간이 많이 걸리는 영상이나 렌더링을 빠르게 수행하는데 이점이 되었습니다. GPU는 게이머와 VR/AR의 틈새 시장에서 시작하여, AI 시대인 현재 자율주행, 의료영상 분석 등 다양한 산업 분야로 그 활용 범위가 확대되고 있습니다.
최근에는 GPU를 넘어 GPU as a Service(GPUaaS)가 주목받고 있는데요. 이번 인사이트 리포트에서는 GPUaaS가 GPU와 무엇이 다른지, 또 AI 시대에 서비스형 GPU가 왜 필요한지를 설명드리겠습니다.
3D 모델링 및 애니메이션의 사용이 점점 더 많아짐에 따라 GPU를 활용한 고성능 컴퓨팅에 대한 수요가 높아지고 있습니다. 대표적으로 애니메이션 스튜디오의 경우, 애니메이션 장편 영화의 품질을 향상시키기 위해 GPU 솔루션을 제공하는 회사와 협력할 수 있겠죠.
뿐만 아니라 업종 전반에서 딥러닝, 인공지능(AI), 빅데이터 분석을 기반으로 한 제품 설계, 개발, 데이터 분석이 활발히 이루어지고 있습니다. 이러한 기술을 효과적으로 활용하기 위해 많은 기업이 IoT(사물인터넷) 및 IIoT(산업 사물인터넷)을 적극적으로 도입합니다. 이러한 변화에는 프로세스 확장과 속도 향상이 필수적이며, 이를 지원하기 위해 고성능 GPU의 필요성이 더욱 커지고 있습니다.
그러나 대부분의 기업이 GPU 인프라를 온프레미스(On-premise)로 설정하는 것은 어려운 일입니다. 최적의 사용을 위해 GPU 인프라 수요를 예측하고 계획하는 것 또한 매우 어렵습니다. 이것이 바로 GPUaaS(GPU as a Service)가 등장한 이유입니다.
GPUaaS는 기본적으로 GPU 인프라를 주문형으로, 탄력적으로 프로비저닝하기 위한 것입니다. 저비용 영향, 클라우드 서비스 제공업체의 지원과 온디멘드 확장성은 GPUaaS의 주요 이점이라 할 수 있습니다. 대부분의 비즈니스에서 적용이 가능하다는 점도 장점입니다.
전 세계적으로 클라우드 컴퓨팅으로의 이동이 증가함에 따라 GPUaaS 시장이 더욱 촉진되고 있습니다. 이를테면 비디오 편집, 그래픽 디자인 및 이미지 처리에 사용되는 여러 그래픽 응용 프로그램에는 업그레이드된 GPU가 장착된 고성능 컴퓨터가 필요한데요. GPUaaS의 등장으로 고급 GPU를 구입할 필요 없이, 클라우드 기술을 활용하여 SaaS, IaaS 및 PaaS 형태로 GPU의 처리 능력을 사용할 수 있게 되었습니다.
Global Market Insights에 따르면, GPUaaS(GPU as a Service)의 시장은 2019년에서 2025년까지 CAGR 38% 이상으로 성장하여 70억 달러 규모를 초과할 것으로 예상됩니다. 암호화폐 채굴의 급격한 증가와 다양한 지역의 클라우드 게임 시장의 급증으로 인해, 2019년에서 2025년 사이에 가속화된 성장이 예상됩니다. 대표적인 GPUaaS 활용 분야로 부동산 부문, 딥러닝과 빅데이터의 응용, 그리고 클라우드 게임을 들 수 있습니다.
부동산 부문에서는 인프라를 3D 애니메이션으로 표현하고, 투자자와 고객을 유치하기 위한 3D 렌더링과 건축 디자인 서비스가 시장 성장을 뒷받침하고 있습니다. 기업의 제품 개발을 위한 시각 효과의 필요성이 증가함에 따라, CAD(Computer-aided Design) 및 CAM(Computer-aided Manufacturing)을 위한 GPUaaS 수요 역시, 제조에서 자동차 산업에까지 다양하게 확대될 것입니다.
딥러닝과 빅데이터와 같은 기술의 확산도 시장 성장을 뒷받침할 것입니다. 산업 전반의 디지털 전환의 결과로 데이터센터의 수가 증가하였고, 그 결과로 다양한 예측 분석 도구의 필요성이 생겨났죠. 데이터의 분석과 예측을 통한 환경 모델링, 분자 및 생명 공학 분석 등의 수요가 증가함에 따라 시장은 더욱 성장할 전망입니다.
게임 산업도 GPUaaS 시장 성장을 견인할 것입니다. 스마트 장치의 확산과 인터넷 보급률 증가는 전 세계적으로 온라인 게임 사용자의 수를 꾸준히 늘려왔죠. 특히 클라우드 게임은 강력한 게임용 PC가 없는 게이머에게 끊김 없는 고화질 게이밍 경험을 선사합니다. 시간당 지불 방식의 구독을 통해 더 많은 게이머를 창출하면서도, 불법 복제 가능성을 낮추어 게임 개발자에게도 이익이 되죠. 이러한 클라우드 형태로 게임을 구현하는 데에는 GPUaaS가 필수적입니다. 게임 외에 제조, 디자인/제조, 자동차, 헬스케어, 부동산, 교육 등의 산업에서 GPUaaS의 시장은 성장할 것으로 예측됩니다.
GPUaaS 제공을 위해서는 클라우드 서비스 업체(CSP)와 GPU 업체가 필요한데요. 이들 두 업체 간의 지속적인 협력을 통해 GPUaaS 시장이 더욱 성장할 것입니다. 이를테면 Microsoft 및 Amazon과 같은 글로벌 클라우드 서비스 제공업체는 NVIDIA 및 Intel을 포함한 GPU 제공업체와 파트너십을 맺고 있습니다. 그 예로 Amazon Web Services는 딥러닝 알고리즘을 기반으로 하고 Intel GPU로 구동되는 AWS DeepLens AI Dev Kit을 발표하기도 했습니다.
클라우드에서 스트리밍되는 영화, TV프로그램, 음악 등의 엔터테인먼트 콘텐츠는 지난 10년 동안 일상 생활의 일부가 되었습니다. 넷플릭스, 아마존, Spotify, SoundCloud와 같은 업체들 모두 해당 시기에 두각을 나타내기 시작했죠. 컴퓨터 게임 스트리밍은 개념 자체를 확립하는데 좀 더 오랜 시간이 걸렸지만, 전문가들은 세계 클라우드 게임 시장이 2019년에서 2025년 사이에 42% 성장할 것으로 전망하고 있습니다.
여러 대형 클라우드 서비스 제공업체(CSP)들과 통신사들은 직접 클라우드 게임을 제공하거나, 이 시장의 주요 업체들을 위한 서비스와 오퍼링을 출시하는 전략을 취합니다. 이를 통해 사용자들의 노트북, 태블릿, TV, 휴대전화와 같은 장치에서 게임을 스트리밍하죠. 클라우드 게임의 이용자들은 정기적인 하드웨어나 콘솔의 업그레이드가 불필요하고, 게임의 개발자들은 사용자에 대한 걱정 없이 게임에 대한 업데이트가 가능하게 됩니다. 게이머들의 참여를 증가시킬 수 있는 잠재력을 가지게 된 것이죠.
디지털 게임 수요와 함께 게임 기기의 다양성이 증가하면서, 클라우드 게임의 확산은 불가피한 선택이었습니다. 디지털 게임 산업은 데스크탑, 워크스테이션, 모바일 및 게임 콘솔과 GPU의 통합으로 엄청난 활력을 얻었으며, 지난 몇 년 동안 증강현실(AR)과 가상현실(VR) 장치가 게임 경험을 향상시키게 됨에 따라 점점 더 큰 인기를 얻게 되었습니다.
그러나 클라우드 게임 산업의 성장은 게임을 뒷받침하는 클라우드 인프라의 발전을 요구하였습니다. 고급 CPU로도 처리할 수 없는 연산 성능이 필요해진 것이죠. 시각적 콘텐츠를 향상시키고 실시간에 가까운 그래픽 집약적인 게임을 스트리밍하려면 상당한 양의 대역폭과 안정적인 인터넷 연결이 필요하고, 이러한 하드웨어 기능에 대한 수요를 처리하기 위해 클라우드 게임 서비스는 GPUaaS를 채택했습니다. GPUaaS 사용으로 수백 개의 그래픽 집약적인 게임을 높은 프레임 속도로 동시에 스트리밍할 수 있어 지연 시간을 줄일 수 있게 됩니다.
Global Market Insights의 연구 보고서에 따르면, 아시아 태평양 GPUaaS 시장은 2019년에서 2025년 사이에 40% 이상의 CAGR로 가장 빠른 성장이 예상됩니다. 아시아 태평양 지역은 게임 시장의 핵심 기여자로 GPUaaS 기반의 클라우드 게임을 빠르게 채택하여 산업 성장을 이끌고 있습니다.
오늘날의 컴퓨팅 집약적 비즈니스 환경에서는 데이터를 얼마나 효과적으로 활용할 수 있는가가 비즈니스 성공의 핵심 지표가 되고 있습니다. AI 채택이 증가함에 따라, 기업들은 머신러닝(ML), 딥러닝(DL), 데이터 분석에서 발생하는 문제를 해결하기 위해 강력한 컴퓨팅 및 스토리지 성능을 요구하게 되었습니다.
기업이 AI 혁신을 시작할 때 가장 일반적으로 선택하는 인프라 중 하나가 GPU를 활용한 머신러닝 및 딥러닝입니다. 프로세스 집약적인 여러 산업에서 GPU의 데이터 처리 능력은 무한한 가능성을 지니고 있죠. 방대한 GPU 컴퓨팅 성능을 활용하면 기업은 대규모 데이터셋에서 고도화된 비즈니스 인텔리전스를 놀라운 정확도와 속도로 도출할 수 있습니다. GPU를 통해 전체 데이터 셋을 수용하므로, 사용자는 즉시 수십억 줄에 걸친 데이터 워크플로우를 시각화, 쿼리 및 실행할 수 있으며, 고객은 엄청난 양의 데이터에서 패턴과 통찰력을 즉시 찾아낼 수 있게 됩니다.
그러나 많은 엔터프라이즈 기업은 다양한 AI 애플리케이션 및 사용사례를 위한 여러 데이터 사이언티스트 팀의 GPU에 대한 수요를 충족하는 것이 어려울 수 있습니다. 일반적으로 기업은 단일 애플리케이션 전용 GPU 서버를 프로비저닝 및 배포하기 때문에 서로 다른 팀은 차례가 올 때까지 대기해야만 했습니다.
이러한 문제를 해결하기 위해 GPUaaS(GPU-as-a-Service)가 등장했습니다. GPUaaS(GPU-as-a-Service)는 GPU 가속 애플리케이션에 대한 주문형 및 탄력적 프로비저닝을 제공하는 동시에, 여러 애플리케이션에 GPU 인프라 리소스를 공유하고 할당합니다. 즉, 여러 서버의 GPU 풀을 여러 머신러닝/딥러닝 응용 프로그램에 걸쳐 통합하고 공유할 수 있으며, 각 응용프로그램에는 적절한 수의 GPU가 할당됩니다. 또한, 개발자가 딥러닝 교육과 예측 모델에 대한 실험과 배포를 보다 쉽게 수행할 수 있도록 하여, 딥러닝 애플리케이션을 가속화하고 단순화할 수 있습니다.
AI 기반 애플리케이션의 성장과 실시간 분석에 대한 수요 증가로 인해 고성능 컴퓨팅 기술도 함께 발전하고 있습니다. 자율주행 자동차에서 양자 컴퓨팅에 이르기까지, AI는 점점 더 강력한 컴퓨팅 기능을 제공하며 여러 인지 작업에서 인간을 능가할 것으로 예상됩니다.
글로벌 기업들은 이러한 AI 애플리케이션을 GPU와 통합하여 새로운 고객을 유치하고 있습니다. 예를 들어, NVIDIA는 다중 GPU와 딥러닝 알고리즘을 통합한 ‘NVIDIA 딥러닝 SDK’를 출시했습니다. 통합 솔루션으로 구동되는 고밀도 GPU 환경을 생성하고 자동화된 실시간 인텔리전스와 통찰력을 제공하였죠.
VMware는 2020년 AI 및 머신러닝 애플리케이션을 위한 GPUaaS 솔루션인 ‘v스피어 비트퓨전(vSphere Bitfusion)’을 발표했습니다. AI 및 머신러닝 기반 애플리케이션 중 특히 딥러닝 학습을 요구하는 애플리케이션은 방대한 데이터 처리와 고성능 연산을 필요로 하죠. 이를 위해 기업이 GPU 리소스를 서버에 할당하고 데이터센터 내에서 공유할 수 있도록 지원하는 솔루션입니다.
Duke University는 학생과 연구원의 AI와 머신러닝 실행을 위한 GPU 리소스가 필요했습니다. 제한된 GPU풀과 대규모 사용자 풀을 조정하는 것이 과제였죠. 이에 VMware의 v스피어 비트퓨전을 사용하여 GPUaaS 환경을 구축하고, 연결된 풀에서 GPU 사용률을 공유하고 활용률을 높여 다양한 시간에 다양한 요구사항과 우선순위를 충족할 수 있었습니다.
삼성SDS도 AI 연구개발용 GPU 클러스터링 기술을 활용한 R&D Cloud for AI를 제공하고 있습니다. 고성능 GPU를 클러스터링을 통해 하나로 통합하여 전체 가용량을 늘리고, 클러스터링 된 자원에 분배 기술을 적용하여 필요한 사용자가 필요한 시점에 필요한 만큼 효과적으로 활용할 수 있도록 제공합니다. 또한, 사용자가 원하는 환경을 가상화된 컨테이너로 제공하여 AI 개발환경 세팅에 드는 시간을 줄이고 AI 연구 자체에 집중할 수 있으며, AI 연구에 특화된 스케쥴러를 통해 Job의 순서와 배치를 조정하여 자원 활용 효율성을 극대화할 수 있습니다.
병렬 연산에 특화된 GPU는 AI 연구개발을 가속화하는데 핵심 요소가 분명합니다. 참고로, 시장 조사업체 리프터(Liftr)는 2019.5월에 아마존 웹 서비스(AWS), 마이크로소프트 애저, 구글 클라우드, 알리바바 등 글로벌 4대 클라우드 데이터센터에서 사용하는 AI 가속기의 97.4%가 엔비디아 GPU라는 조사결과를 발표한 바 있습니다.
Company | Accelerator | March 2019 | April 2019 | May 2019 |
---|---|---|---|---|
Nvidia | GPU | 97.0% | 97.3% | 97.4% |
AMD | GPU | 1.2% | 1.1% | 1.0% |
Xilinx | FPGA | 1.1% | 1.0% | 1.0% |
Intel | FPGA | 0.6% | 0.6% | 0.6% |
Intel | FPGA | 0.6% | 0.6% | 0.6% | Total Types | All | 1,852 | 1,990 | 2,003 |
GPUaaS 시장은 NVIDIA, AMD, Intel과 같은 저명한 GPU 글로벌 플레이어로 인해 고도로 집중된 시장입니다. 이들은 주요 시장 점유율과 광범위한 글로벌 입지를 갖추고 있으며, IBM, Microsoft, Google 및 Amazon과 같은 주요 클라우드 서비스 업체와 협력하여 가상현실(VR)과 증강현실(AR) 기술을 포함한 클라우드 게임 경험을 제공하고, 시장 성장을 확대하기 위해 기술 혁신 및 개발에 집중하고 있습니다.
AI 시대가 개막과 함께 방대한 데이터를 정해진 수식으로 처리하는 딥러닝 분야가 활발해짐에 따라, 병렬처리에 특화된 GPU가 더욱 빛을 발하게 되었습니다. GPUaaS를 통해 원격 위치에서 강력한 GPU 기능에 대한 엑세스를 제공하여, 고급 GPU를 구입할 필요 없이 클라우드 기술을 활용하여 GPU의 처리 능력을 사용할 수 있습니다. 이러한 서비스는 구독당 지불하는 방식으로 비용 효율적이고, 사용자의 워크로드에 따라 동적 가격 범위에서 다양하게 선택할 수 있습니다.
GPUaaS를 통해 몇 주, 몇 달이 아닌 몇 시간, 며칠 단위로 머신러닝과 AI 작업 속도를 높여 작업 완료 시간을 단축할 수 있으며, GPU로 구동되는 AI를 이용하여 직원 승인, 결제 처리, 판매 할인 등의 프로세스를 자동화하거나 당뇨병으로 인한 실명의 조기 징후를 감지하기 위해 다국어 AI 음성 엔진을 훈련하는 것과 같은 다양한 작업에 활용할 수 있습니다.
GPUaaS는 클라우드 및 AI 애플리케이션에서 더욱 중요해질 것이며, CAD, 모델링, 시뮬레이션, 3D 애니메이션 등의 사용을 기반으로 지속적으로 성장할 것입니다.
▶ 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶ 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.
삼성SDS 전략마케팅팀
IT 동향 분석, 프로세스 혁신 및 경영전략 수립의 컨설팅 업무 경험을 기반으로, 삼성SDS 닷컴 내 Digital Transformation 및 솔루션 페이지 기획/운영 업무를 수행하였고 SDS 주요 사업영역별 동향/솔루션 분석을 통한 컨텐츠 기획 및 마케팅을 수행하고 있습니다.