삼성SDS 생성형 AI 서비스 - Simply Fit, Simply Chat

2023-11-03 홍은주

삼성SDS 생성형 AI 서비스 Simply Fit, Simply Chat

- 2023년 9월, 삼성SDS가 개최한 REAL SUMMIT 2023에서 발표된 키노트와 세션 내용을 기반으로 작성되었습니다. -

2023년은 수많은 거대 언어 모델(LLM, Large Language Model)과 생성형 AI 관련 소식들이 쏟아졌고, 그중에서 ChatGPT는 최근 들어 가장 핫한 이슈였습니다. ChatGPT가 PC나 핸드폰에서 웹에 접속하여 간단히 회원 가입만 하면 누구나 쉽게 서비스를 이용할 수 있듯이, ChatGPT 등의 생성형 AI 애플리케이션(앱)은 복잡한 설치 과정이나 특별한 기술 지식 없이도 사용할 수 있습니다.

그러나, 기업이 생성형 AI를 도입하기 위해서는 수많은 검토 사항과 해야 할 많은 일들이 존재합니다. 가장 기본이 되는 LLM과 데이터, 생성형 AI에 항상 수식어처럼 따라다니는 파인튜닝(Fine-tuning)과 프롬프트 엔지니어링(Prompt Engineering) 뿐만 아니라, 생성형 AI의 기반이 되는 클라우드와 GPU 인프라 등 모든 것들이 준비되어야만 합니다. 여기에 기업이라면 가장 신경 써야 할 보안 까지 기업이 생성형 AI를 도입하는 것은 결코 쉬운 일이 아닙니다.

이번 글에서는 생성형 AI를 업무 프로세스에 도입하는 기업들이 거쳐야 하는 과정에 대해 알아보고, 그 과정에서 삼성SDS의 서비스만이 드릴 수 있는 가치를 소개하겠습니다.

생성형 AI 도입에 직면한 기업들은 어떤 고민을 가지고 있나요?

삼성SDS는 지난 8월, 24개 중견 및 대기업 고객들과 생성형 AI에 대한 논의를 진행했습니다. 그 결과, 83% 기업은 업무 프로세스를 자동화하고 효율화하여 생산성을 향상하기 위해 생성형 AI 도입을 계획하고 있었고, 9% 기업은 고객 서비스 향상을 기대했습니다. 또한, 기업의 92%가 생성형 AI 도입을 검토하거나 PoC를 진행하며 외부 LLM 또는 현재 개발되고 있는 오픈소스 LLM에 대한 검증 작업을 수행하고 있었고, 이미 생성형 AI를 도입한 기업도 4% 수준이었습니다.

생성형 AI에 대한 기업의 기대 (출처: 삼성SDS)

생성형 AI 도입에 직면한 기업들은 다음과 같은 고민을 가지고 있습니다.

첫째는 기업마다 가지고 있는 특수하고 민감한 데이터의 누출과 악의적인 사용자로부터의 정보 왜곡 및 무단 접근 등 ‘보안’에 대한 우려였습니다.
둘째는 '정확도'로 생성형 AI 모델이 부정확하거나 편향된 답변을 생성하거나 모델이 컨텍스트를 이해하지 못해 기업에서 필요로 하는 답을 받지 못하는 일이 발생하는 경우입니다.
마지막으로 '비용'적인 측면도 고려하지 않을 수 없습니다. 생성형 AI 모델 라이선스와 구독 비용은 사용자 수, 사용량, 서비스 수준에 따라 커질 수 있고, 클라우드 서비스와 GPU/TPU 등의 인프라 비용도 기업에는 큰 부담이 될 수 있습니다.

그러한 고민을 해결하기 위한 생성형 AI 도입의 여정은 어떻게 정의할 수 있을까요?

생성형 AI는 기술 특성상 전반적으로 사전 검증을 거친 후, 비즈니스에 본격적으로 도입하게 됩니다.

기업의 생성형 AI 도입 여정 (출처: 삼성SDS)

1. 도입 타당성 검토: 첫 단계로 기술 동향 분석과 활용 사례 검토를 통해 시장 상황을 검토한 후, PoC나 MVP(Minimum viable product)를 통해 도입 타당성 검토를 수행합니다.
2. Use Case 정의: 생성형 AI를 도입하기로 결정하면 본격적인 Use Case 정의 단계로, Use Case 발굴 및 적합성을 검토한 후 구현 계획을 수립합니다.
3. 서비스 구현: 파운데이션 모델(Foundation Model, FM)이나 LLM 등 적합한 모델을 선정하고, 모델에서 활용할 데이터 확보와 전처리 과정을 수행합니다.
4. 벡터화 및 데이터 최적화: 비정형 데이터 활용을 위한 벡터라이제이션 과정을 진행하게 됩니다. 벡터 임베딩(Vector Embedding)*된 데이터를 실제 애플리케이션에서 활용하기 위해서 선택한 LLM을 기업 전용으로 튜닝하거나, 기업 데이터 자체를 활용해 환각(Hallucination)을 최소화할 수 있는 데이터 최적화 단계를 진행하게 되며, 지속적으로 성능을 모니터링하고 교육을 통한 확산의 여정을 거치게 됩니다.

용어 설명

벡터라이제이션(Vectorization): 여러 토큰들을 기계가 이해할 수 있도록 다차원의 실질적인 숫자로 변환하는 것
벡터 임베딩(Embedding):사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자의 나열인 벡터로 바꾼 결과 혹은 그 과정 전체를 의미

도입 과정에서 많은 작업이 필요해 보이네요. 각 단계에 대해 조금 더 자세히 설명해주실 수 있나요?

설명드린 생성형 AI 도입의 전체 여정에서 가장 중요하다고 할 수 있는 세 가지 요소인 ‘Use Case 발굴’, ‘FM/LLM 선정’, 그리고 ‘모델 최적화’에 대해서 조금 더 살펴보겠습니다.

1) Use Case 발굴

Use Case 발굴은 생성형 AI 도입의 결과로 가기 위한 지도와 같습니다. 먼저, 기업이 속한 산업군의 특성과 요구사항을 잘 파악하고, 조직 구조와 기능을 분석하여 현재 직면하고 있는 문제나 개선 가능성 있는 부분을 찾아냅니다. 멀티 모달, 텍스트, 이미지, 코드, 보이스, 비디오 등을 생성할 수 있는 각 생성형 AI 기능을 기반으로 도입의 목적과 ROI를 달성할 수 있는 Use Case 도출이 필요합니다.

2) FM/LLM 선정

최근 많은 이슈가 되었던 'GPT-4'와 'PaLM 2' 등을 포함하여, 다양한 LLM들이 지속적인 연구 개발을 통해 빠르게 진화하고 있습니다. LLM은 Open-Source와 Closed-Source 모델이 존재하며, 구글 ‘PaLM 2’의 경우에는 두 가지 모델을 모두 보유하고 있습니다. 삼성SDS는 8월 말 발표된 네이버클라우드의 'HyperCLOVA X'를 포함한 모든 LLM의 급변하는 변화와 혁신의 내용을 파악하여 기업에 필요한 최적의 LLM을 제공할 예정입니다.

다양한 LLM의 진화 (출처: 삼성SDS)

그렇다면, LLM을 선정하기 위한 검토 기준에는 무엇이 있을까요? 기업의 비즈니스 전략에 부합하는 최적의 LLM을 선정하기 위해서는 성능, 비용, 서비스 호환성, 언어 등 다양한 기준에서 비교 분석이 필요합니다.

성능 측면에서는 'BLEU'나 'ROUGE'와 같은 성능 관련 지표를 통해 각 모델의 성능을 비교합니다. BLEU(Bilingual Evaluation Understudy)는 텍스트 번역이 얼마만큼 컨텍스트에 맞게 번역되었는지를 측정할 수 있는 지수이고, ROUGE(Recall-Oriented Understudy for Gisting Evaluation)는 텍스트 요약과 번역을 측정할 수 있는 하나의 스탠더드 매트릭스입니다. 최근 스탠퍼드 대학에서 발표한 HELM(Holistic Evaluation of Language Models)은 언어 모델의 투명성을 측정할 수 있는데, 이렇게 다양한 기법의 성능 측정으로 LLM이 얼마만큼 액티브하게 적용될 수 있을지 판단할 수 있습니다.

비용 측면에서는 토큰 기반으로 과금되는 LLM 사용료에 대한 고려가 필요합니다. 한국어는 영어 등에 비해 보통 4~5배의 토큰으로 인식되기 때문에 국산 모델을 사용하거나 최적화된 토크나이징을 활용할 수 있으며, 컨설팅을 통해 사용료를 예측하고 제안할 수 있습니다. 이후에 인프라 비용, 구축 및 운영 인건비 등을 고려해 최적의 LLM을 선택해야 합니다.

또한, 서비스 호환성 측면에서도 고민이 필요하며, 기업의 내부 인프라나 애플리케이션과 잘 맞는 LLM인지 확인하는 것도 중요합니다. 마지막으로, 특정 언어에 대한 지원이 필요하다면 해당 언어에 대한 강점과 지원 여부를 확인해야 하며, 다양한 프로그래밍 언어 지원 여부도 체크해야 합니다.

LLM 검토 기준 (출처: 삼성SDS)

기업에서 일하는 업무를 고려한 LLM 선정 과정을 살펴보면, 해외 영업은 'GPT-4'와 같은 상용화된 LLM을 통해서 질의응답 및 번역 작업을 수행할 수 있습니다. 개발자의 경우, 코드 어시스턴트를 해줄 수 있는 많은 LLM이 존재합니다. 'StableCode'는 프로그래밍 언어를 잘 이해하고 적절한 코드 영역을 생성할 수 있고, 최근에는 '코드 라마(Code Llama)'라는 메타의 오픈소스 LLM도 출시되었습니다. 코드 어시스턴트는 이미 10년 전부터 존재해 왔으며, 인공지능을 통해서 많은 부분이 자동화되었다고 볼 수 있습니다.

디자인 업무는 다양한 레퍼런스 이미지를 찾아내거나, 클라이언트가 원하는 의도를 반영한 이미지를 만들어야 하는 작업이 많습니다. 'GPT-4'를 통해 디자인을 위한 리서치가 가능하고, 'DALL·E'와 'Stable Diffusion'을 통해 창의적인 디자인을 빠르게 생성하여 아이디어를 도출할 수 있습니다. 또한, 마케팅 업무의 경우에는 'GPT-4'는 물론이고 'HyperCLOVA X'를 통해 리서치나 분석 작업을 손쉽게 할 수 있습니다.

3) 모델 최적화

이렇게 수많은 LLM 중에서 하나를 선정했다고 해서 바로 완성도 높은 결과물을 얻을 수 있는 것은 아닙니다. 이를 위해서는 LLM 자체를 고도화 및 최적화하는 과정이 반드시 필요합니다.

Pre-training 과정은 LLM을 구성하고 생성하기 위해 필요한 과정이기 때문에 방대한 훈련 비용과 데이터, 그리고 인프라가 필요합니다. 잘 아시겠지만, 'ChatGPT 3.5'가 출시되었을 때 수천 명에 달하는 인력의 피드백을 통해 모델의 정확도를 높였다는 보도가 있었습니다.
Fine-tuning은 마치 우리가 기본적인 지식을 배운 후, 특정 분야의 전문 지식을 습득하는 것과 비슷하다고 볼 수 있습니다. 즉, 기존의 LLM 모델에 기업 전문성에 특화된 문서나 스킬을 입히는 과정으로 더욱 정교한 결과를 얻을 수 있습니다. PEFT(Parameter Efficient Fine-Tuning), SFT(Supervised Fine-Tuning), RLHF(Reinforcement Learning from Human Feedback) 등의 기법을 통해서 도메인에 특화된 데이터를 효율화하고 모델의 성능과 품질을 개선할 수 있습니다.
RAG(Retrieval-Augmented Generation)는 일반적으로 기업이 가지고 있는 파워포인트나 PDF 등 비정형화된 자료들을 임베딩하여 데이터베이스화하고, 실제 쿼리 시 이를 통해 정보를 얻을 수 있도록 하는 검색 증강 기술로 환각 없는 정확한 응답 생성이 가능합니다.
마지막으로, Prompt Engineering은 사용자가 대화를 시작할 때 제시하는 문장(Prompt)에 컨텍스트(Context)를 바로 입력하고 맥락 내 학습(In-Context Learning)을 통해서 결과의 완성도를 높이는 것으로 굉장히 적은 비용으로 특화된 데이터를 최적화할 수 있습니다.

생성형 AI 데이터 최적화 방법 (출처: 삼성SDS)

이 모두가 데이터를 최적화하기 위해 활용할 수 있는 방법이지만, 기업 내부 데이터의 보안을 유지하면서 생성형 AI를 최적화하기 위해서는 주로 Fine-tuning, RAG를 고민해야 합니다. 최적화를 위해 Fine-tuning 기법 모두를 사용할 수도 있고, 상황에 따라 필요한 기법만 사용할 수 있습니다. 혹은, Fine-tuning 없이 RAG를 활용하거나, Prompt Engineering만으로 품질을 개선할 수도 있습니다.

그렇다면 삼성SDS는 기업의 생성형 AI 도입에 어떤 도움을 줄 수 있나요?

앞서 설명한 것처럼, 기업의 비즈니스에 생성형 AI를 효과적으로 도입하기 위해서는 다양한 요소들을 고려하고 준비해야 합니다. 이러한 요소들은 기술적인 부분부터 비즈니스 전략, 그에 따른 실행 계획 등 다양한 범위를 포함하는데, 이러한 복잡성 때문에 많은 기업들이 생성형 AI 도입을 고민하면서도 실제로 실행에 옮기는 데 어려움을 겪고 있습니다. 삼성SDS는 복잡한 생성형 AI 도입의 모든 여정에서 함께하며, 단계별로 다시 정리하면 다음과 같습니다.

삼성SDS 생성형 AI 매니지드 서비스 (출처: 삼성SDS)

(1) Plan(검토)

‘검토 단계’는 생성형 AI를 도입하기 위한 초기 계획을 수립하는 과정으로 그 중심에는 타당성 분석과 마스터 플래닝이 있습니다. 환경 분석과 Use Case를 통해 생성형 AI가 비즈니스에 어떻게 적용되고 어떤 가치를 창출할 수 있는지에 대한 타당성을 평가하고, 이후 To-Be 모델을 정의하며 구체적인 실행 계획을 수립합니다.

(2) Plug(도입)

‘도입 단계’는 데이터 준비, 모델링, 서비스 구현의 단계를 거치게 됩니다. 생성형 AI 서비스 구현을 위해서는 데이터의 확보와 관리가 매우 중요합니다. 따라서, 데이터 준비 단계에서는 기업의 데이터 정책을 수립하고, Use Case에 따라 필요한 데이터를 설계, 수집 및 정제한 후, 모델 학습과 비정형 데이터 저장을 위한 임베딩을 수행합니다. 데이터 준비와 함께 모델에 대한 작업을 진행합니다. 즉, 모델링 단계에서는 앞서 설명한 대로 선정된 모델에 대한 학습과 Fine-tuning을 지속적으로 수행하여 서비스를 위한 최적의 모델을 확보하게 됩니다. 이후, 생성형 AI 서비스의 효율과 성능을 높이기 위해 오케스트레이터 구성, Plug-in/API 연동 및 필터링 등을 적용하여 생성형 AI를 실제 비즈니스 애플리케이션 서비스로 구현하게 됩니다.

(3) Play(운영/관리)

‘운영/관리 단계’는 실제 운영 환경에서 데이터, 모델 및 Prompt Engineering에 대한 지속적인 최적화와 관리 작업을 수행합니다. 기업은 생성형 AI의 성능을 유지하고 개선하는 데 필요한 전문적인 작업을 안심하고 맡길 수 있을 뿐만 아니라, 다양한 교육 프로그램을 통해 자체적으로 AI 시스템을 관리하고 최적화하는 역량을 확보할 수 있습니다.

생성형 AI 서비스 구성을 지원하는 'FabriX'에 대해 자세히 알려주세요.

생성형 AI 서비스를 구성하기 위해서는 사내 업무 시스템과 외부 LLM뿐만 아니라 「서비스, 데이터, 학습」 등 다양한 모듈과의 연계가 필요합니다.

서비스 모듈은 통합 포털과 함께 인증 및 권한 관리 기능을 제공하며, 여러 LLM의 오케스트레이션과 기업의 보안을 위한 필터링 기능 및 사내 업무시스템 데이터와 연계할 수 있는 RAG 기능을 포함하고 있습니다. 가장 중요한 데이터 모듈은 정형, 비정형 데이터를 수집하고 전처리 및 벡터화까지를 지원하며, 마지막으로 학습 모듈은 모델을 사전 학습한 후 모델 저장소에 올려서 파인튜닝의 선순환을 지원하고 용도에 따라 다양한 LLM을 적용할 수 있도록 LLMOps 기능 등을 제공합니다.

기업은 이렇게 복잡한 생성형 AI 서비스를 어떻게 수월하게 구성할 수 있을까요? 삼성SDS는 위에서 설명한 생성형 AI 서비스의 세 가지 모듈을 기반으로 기업의 사내 업무 시스템과 외부 LLM에 대한 '연결'을 간편하게 할 수 있도록 지원합니다. 많은 기업이 Use Case 발굴도 어렵고, 어떤 LLM을 써야 할지도 고민이고, 업무 시스템과 어떻게 연결을 해야 할지 모르겠다는 이야기를 많이 합니다. 그렇기 때문에 생성형 AI의 본격적 활용과 혁신의 시작은 '연결'이라고 볼 수 있습니다.

업무를 자동화하고 생산성을 혁신하려면, 생성형 AI가 기업 내 ERP, SCM, MES, CRM 등의 기간계 시스템에 접속할 수 있어야 하고 기업 내에만 존재하는 지식, 문서, 데이터도 가져올 수 있어야 합니다. 삼성SDS는 생성형 AI 전문 인력과 함께, 기업의 업무 시스템과 데이터, 그리고 기업에서 필요한 다양한 LLM을 더 쉽고 간편하게 연결/활용해 기업의 하이퍼오토메이션을 가속(Accelerator)할 수 있는 '패브릭스(FabriX)' 플랫폼을 제공하고 있습니다.

삼성SDS 생성형 AI 서비스 구성 & FabriX (출처: 삼성SDS)

삼성SDS FabriX 플랫폼의 특징

아무리 복잡한 시스템과 데이터라도 심플하게 연계하는 것을 목표로 했기 때문에, 플러그인(Plug-in), RAG, LLM, 문서, 지식자산 등이 ‘카탈로그’라는 형태로 모이게 됩니다.
데이터 카탈로그를 활용하여 데이터 분석과 그래프를 보여주는 Python 코드를 생성하고 실행하는 'Code Interpreter'를 제공합니다.
RAG, API Agent 및 Co-pilot에서 사용하는 Plug-in을 기본으로 제공하고, 사용자가 커스텀 Plug-in을 만들어 사용할 수도 있는 'Plug-in Develop'도 제공합니다.
'Low Code Co-pilot'을 통해 기업의 업무 시스템에 생성형 Chat 기능을 손쉽게 적용할 수 있습니다.

FabriX는 보안 걱정 없이 생성형 AI를 활용할 수 있도록 삼성 클라우드 플랫폼을 기반으로 프라이빗 클라우드를 구축하고, 데이터 수집, 저장, 전처리, 인증/권한 관리, 필터링 등을 안전하게 처리할 수 있습니다.

그렇다면 생성형 AI 서비스 도입에 있어 삼성SDS만이 가지는 경쟁력은 무엇일까요?

생성형 AI 도입을 고민하는 기업들이 고려할 수 있는 삼성SDS의 경쟁력은 다음과 같습니다.

삼성SDS 생성형 AI 서비스 강점 (출처: 삼성SDS)

1) 기업 업무 전문성을 통한 Use Case 구현

삼성SDS는 다양한 시스템 구축 사업과 AI 및 데이터 서비스 사업을 통해 축적된 도메인 지식을 기반으로 업종별 Use Case를 정의했습니다. 제조, 엔지니어링, 금융, 서비스, 바이오/헬스케어 등 다양한 업종과 10개의 특화/공통 기능 측면에서 Use Case를 고민했으며, 그 외 많은 부분에서도 진행 중입니다. 이렇게 정의된 Use Case를 통해 기업은 비즈니스에 적합한 Use Case 후보군 도출 및 상세화를 쉽고 빠르게 진행할 수 있습니다.

2) 맞춤형 클라우드 인프라 제공

삼성SDS는 국내 유일의 CSP(Cloud Service Provider)와 MSP(Managed Service Provider)의 역할을 동시에 하는 기업으로서 생성형 AI 도입을 위한 맞춤형 클라우드 서비스를 제공합니다. 삼성 클라우드 플랫폼을 비롯해, AWS, Azure, GCP, NAVER Cloud 등 다양한 퍼블릭 클라우드를 제공하고, 클라우드뿐만 아니라 생성형 AI 매니지드 서비스를 통해 AI를 도입/적용하여 디지털 혁신의 여정을 바꿔나가고 있습니다.

생성형 AI 도입을 위한 맞춤형 클라우드 (출처: 삼성SDS)

3) 확장 가능한 생성형 AI 생태계

삼성SDS는 마이크로소프트, 네이버클라우드, 구글 등 다양한 플랫폼 기업과의 전략적 협업을 통해 생성형 AI 생태계를 구축하고 있습니다. 먼저, 마이크로소프트와는 클라우드 분야와 함께 생성형 AI 분야까지 일원화된 파트너십을 구축했습니다. 마이크로소프트는 대화 기반 생성형 AI 시장을 선도하고 있는 기업 중 하나로, OpenAI 'ChatGPT' 서비스를 통해 그 역량을 입증하고 있습니다. 여기에 Cognitive Search, AI Bot Service 및 MS 365 Copilot 등 다양한 AI 서비스를 제공하며, 사업 협력을 통해 강화된 보안과 안정성 기반의 생성형 AI 서비스 구축의 리드 타임을 최소화할 수 있습니다. 또한, 최대 규모의 한국어 데이터를 학습한 'HyperCLOVA X'를 선보인 네이버클라우드와의 협력을 통해서 한국어 환경에 최적화된 기업형 생성형 AI 서비스를 제공할 예정입니다.

그 외에도 구글, 아마존웹서비스, 오픈소스 LLM을 활용해 고객 비즈니스 환경에 맞춘 다양한 서비스를 제공할 계획입니다. 구글의 'PaLM 2'는 'GPT-4' 수준의 추론 능력, 100개 이상의 다국어 이해와 코딩 능력으로 다양한 산업별 Use Case 구현을 지원할 것이고, 아마존웹서비스의 경우에는 자체 언어 모델인 'Titan'과 'Jurassic-2', 'Claude 2', 'Stable Diffusion' 등 검증된 LLM을 지원하는 AI 플랫폼인 'Bedrock'의 preview 권한을 받아 사전에 기능을 경험하고 준비하고 있습니다. 또한, 이미 자체적으로 메타의 'Llama' 모델에 대한 파인튜닝과 최적화 연구를 진행하고 있으며, 180B 파라미터를 가진 'Falcon'을 포함하여 다양한 오픈소스 AI에 대해 연구하고 있습니다.

시장에는 많은 생성형 AI 모델이 존재하고 있고, 앞으로도 발전된 모델이 지속해서 공개될 것입니다. 특정 모델에 Lock-in 되지 않고 기업 환경에 맞는 모델을 식별하고 선택하여 최적화해 나가는 역량은 매우 중요하며, 삼성SDS는 다양한 파트너십과 AI 모델을 기반으로 각 고객 환경에 맞는 최적의 서비스를 제안하고 구현할 것입니다.

삼성SDS가 AI 플랫폼과 함께 클라우드 서비스도 제공한다는 점이 인상적이네요!

네 맞습니다. 생성형 AI 도입을 위해서는 풍부한 양과 좋은 질의 데이터가 필요하고, 이러한 데이터를 잘 저장하고 관리/활용하기 위해서는 기업 환경에 적합한 클라우드 인프라가 필요합니다. 그렇다면 어떤 클라우드가 생성형 AI 서비스 도입에 최적일까요? 기업이 생성형 AI 도입을 위해 고민하는 포인트를 기준으로 보면, ① 회사 기밀/개인정보의 유출 위험이 없어야 하고, ② LLM 학습과 서비스에 필요한 충분한 성능을 제공하며, ③ 데이터의 수집부터 활용에 이르기까지 데이터 핸들링을 위한 Tool과 Asset을 제공해야만 합니다. 이러한 세 가지 항목별로 삼성 클라우드 플랫폼(SCP)이 제공하는 서비스를 살펴보겠습니다.

① Data Protection: 고객이 원하는 위치에

고객들은 일반적으로 "데이터는 내가 위치하는 곳에, 그리고 내가 항상 들여다볼 수 있는 곳에 있었으면 좋겠다."라고 생각합니다. 클라우드는 사업자가 제공하는 '관리 자원'과 고객이 사용하는 '서비스 자원(실질적으로 데이터가 저장되고 가공되는 자원)'으로 구분되며, 관리 자원을 통해 서비스 자원을 관리하게 됩니다. 이 모든 자원을 삼성SDS의 데이터센터에서 제공해 주는 것이 - AWS나 Azure와 같은 - '퍼블릭 클라우드' 서비스입니다. 여기에 삼성 클라우드 플랫폼은 고객의 데이터 보호를 위해 '프라이빗 클라우드(Private Cloud)'와 '데디케이티드 클라우드(Dedicated Cloud)'를 제공합니다. 프라이빗 클라우드는 이미 구축된 내부의 자원을 활용할 수 있도록 서비스 자원을 고객이 지정하는 위치에 유치하여 독점 사용하도록 하고, 관리 자원은 삼성SDS의 데이터센터에서 효율적으로 운영해 줍니다. 데디케이티드 클라우드는 회사의 규모가 크고 전체적인 관리가 필요한 경우로 관리 자원까지 고객이 지정한 위치에 두어 기업이 클라우드를 실질적으로 운영/관리할 수 있습니다. 기업은 이러한 전용 클라우드를 통해 기밀/개인정보의 외부 유출에 대한 우려 없이 데이터를 활용할 수 있습니다.

SCP - 데이터 보호를 위한 프라이빗/데디케이티드 클라우드 (출처: 삼성SDS)

② Performance: 고성능 Multi-node GPU 지원

삼성 클라우드 플랫폼은 AI 서비스를 위해 'GPU VM'과 'Multi-node GPU' 상품을 제공합니다. GPU VM은 통상 GPU 카드가 8장 탑재된 서버로 1장, 2장, 4장 등의 단위로 할당이 되며, 작은 연구 활동에 활용하거나 학습된 모델을 통해 서비스할 때 활용 가능합니다. 이 경우, GPU가 고가이기 때문에 8장 모두를 사용하기보다는 할당 단위로 구독할 수 있습니다. Multi-node GPU는 8장의 GPU 카드가 탑재된 다수의 GPU 서버를 2대, 3대, 4대 혹은 16대 등의 단위로 묶어서 하나의 클러스터로 구성하는 형태입니다. 직접 오픈소스 LLM을 삼성 클라우드 플랫폼에 디플로이하여 서비스하거나, 대용량의 학습이 필요할 때 필수입니다.

삼성SDS는 많은 데이터 사이언티스트를 보유하고 있지만, 전문가라도 GPU 서버를 구축하고 AI 활용을 위해 필요한 쿠다(CUDA, Compute Unified Device Architecture)* 등의 소프트웨어 라이브러리를 설치하여 AI 모델을 올리는 작업은 1~2일 정도의 시간이 소요됩니다. 그러나, 삼성 클라우드 플랫폼의 GPU VM이나 Multi-node GPU 상품은 기능이 임베디드되어 클릭만으로도 GPU 서버를 프로비저닝하고, 다양한 소프트웨어 라이브러리를 설치하여 30분 만에 AI 모델 개발을 위한 개별적인 환경 구성이 가능합니다. 또한, 규모가 큰(ELECTRA-large) 자연어 처리 모델의 경우 Multi-node GPU 기술을 적용하지 않았을 때와 대비해 10배 이상으로 성능이 향상되었는데, 이 결과가 방증하듯이 생성형 AI로 대표되는 LLM에 적용 시 더 높은 성능과 더 많은 시간 단축이 가능합니다.

* CUDA: GPU(그래픽 처리 장치)에서 수행하는 병렬 처리 알고리즘을 C 프로그래밍 언어를 비롯한 산업 표준 언어를 사용하여 작성할 수 있도록 하는 GPGPU 기술임. CUDA 플랫폼은 컴퓨터 커널의 실행을 위해 GPU의 가상 명령 집합과 병렬 연산 요소들을 직접 접근할 수 있는 소프트웨어 계층

삼성SDS가 서비스하는 고성능 Multi-node GPU 자원에 대해 소개합니다.

SCP - 고성능 Multi-node GPU 지원 (출처: 삼성SDS)

③ GenAI Eco: 데이터 처리 작업을 자동화한 Data-driven Cloud

AI 서비스를 위해서는 데이터가 필요하고, 데이터를 가공하여 AI를 통해 인사이트를 도출하는 것이 일련의 데이터 분석의 라이프 사이클입니다. 핵심은 데이터입니다. 데이터는 기업에 산재되어 있습니다. 데이터를 활용하기 위해서는 수집, 정제, 변환해서 일정 기간 저장하고, 카탈로깅을 통해 데이터 레이크 구성 후, Analytics와 AI/ML 분석으로 비즈니스에 필요한 인사이트를 도출할 수 있습니다. 삼성 클라우드 플랫폼은 데이터 활용을 위한 모든 기능을 컴포넌트 상품으로 제공하기 때문에 구독 형태로 선택 및 조합해서 사용할 수 있습니다.

마지막으로 삼성SDS의 생성형 AI 전문 팀이 있다고 들었는데, 소개해주세요!

기업이 생성형 AI 서비스를 Seamless하고 더 빨리 도입할 수 있도록 지원하기 위해 'Generative AI One Team' 프로그램을 운영하고 있습니다. GenAI One Team은 삼성SDS의 컨설턴트와 생성형 AI 및 'FabriX' 플랫폼 등의 기술 전문가들이 모여, 기업 환경에 실제 디플로이하고 'FabriX' 기반의 생성형 AI PoC를 진행하여 기업의 디지털 혁신을 지원하는 프로그램입니다. 이미 기업들은 비즈니스 혁신을 위한 새로운 생성형 AI Use Case를 개발하고 도입하기 위해 저희 One Team과 협력하고 있습니다.

삼성SDS는 다양한 업무 전문성을 기반으로 기업에 특화된 생성형 AI Use Case를 도출하고, 마이크로소프트, 네이버클라우드, 엔비디아 등과의 강력한 파트너십과 삼성 클라우드 플랫폼 및 FabriX를 기반으로 - 모든 클라우드 서비스에 다양한 생성형 AI 모델을 접목하여 기업 고객이 원하는 대로 쉽고 간편하게 생성형 AI 서비스까지 제공하여 - 『Simply Fit, Simply Chat』을 실현할 것입니다.

구하기 어려운 GPU사지 말고 빌려 쓰세요

2024.02.02 ~ 12.31 자세히 보기

이 글이 좋으셨다면 구독&좋아요

여러분의 “구독”과 “좋아요”는
저자에게 큰 힘이 됩니다.

홍은주

삼성SDS 전략마케팅팀

IT 동향 분석, 프로세스 혁신 및 경영전략 수립의 컨설팅 업무 경험을 기반으로, 삼성SDS 닷컴 내 Digital Transformation 및 솔루션 페이지 기획/운영 업무를 수행하였고 SDS 주요 사업영역별 동향/솔루션 분석을 통한 컨텐츠 기획 및 마케팅을 수행하고 있습니다.