무중단 배포 아키텍처(Zero Downtime Deployment)
- 글로벌 서비스 운영의 필수 요소

무중단 배포 아키텍처(Zero Downtime Deployment)- 글로벌 서비스 운영의 필수 요소

들어가며

모든 것이 빠르게 변하는 시대입니다. 그중에서도 IT, 특히 소프트웨어 분야의 역동성은 남다릅니다. 최근 들어 많은 개발자들이 체감하는 가장 큰 변화로 배포(Deployment) 빈도의 증가를 꼽을 수 있습니다. 소프트웨어 개발 방법론이 폭포수(Waterfall) 방식에서 애자일(Agile) 방식으로 바뀌면서 릴리즈 주기가 긴 소프트웨어는 줄어들었습니다. 그만큼 제품은 더 빨리 출시되며 기능 추가와 보완을 위해 더 자주 배포되고 있습니다.

서비스는 과거 하나의 거대한 아키텍처로 구현되는 모놀리식(Monolithic) 구조에서 마이크로서비스(Microservices)로 모듈화되어 독립적으로 개발하고 동시에 배포할 수 있게 되었습니다. 잦은 배포는 시장과 고객의 비즈니스 요구를 빠르게 충족시키고 서비스의 가치를 높입니다. 하지만 운영 안정성 측면에서는 부정적인 영향을 미칠 수 있습니다. 그렇기 때문에 배포는 위험을 최소화하고 안정적으로 수행해야 합니다. 본 아티클에서는 효과적인 소프트웨어 배포 방법을 소개하겠습니다.

소프트웨어 개발과 배포

개발 결과물을 고객에게 제공하기 위해서는 서버에 배포해야 합니다. 최신 애플리케이션들은 클라우드 기반으로 구성되어 트래픽에 따라 탄력적인 확장과 고가용성을 보장하지만 배포 시 서비스를 멈춰야 하는 중단 배포 방식의 경우 다운타임(Downtime)이 발생합니다. 물론 특정 애플리케이션의 경우 계획적으로 다운타임을 허용할 수 있지만 전 세계 사용자를 대상으로 하거나 24시간 운영이 필요한 서비스는 항상 가동되어야 하는 경우가 많습니다. 일반적으로 중단 배포 방식은 더 나은 서비스를 제공하기 위해 오히려 고객의 불편과 손실을 야기할 수 있습니다. 새로운 배포로 인해 문제가 발생하는 경우도 배제할 수 없기 때문에 운영자 입장에서 부담은 늘어나게 됩니다.

반면 무중단 배포 방식은 서비스와 고객에게 부정적인 영향을 최소화하는 좋은 대안이 될 수 있습니다. 안정적인 배포 체계를 갖추는 것은 다양한 비즈니스 요구사항에도 개발에 집중할 수 있게 만들며 이는 곧 서비스의 경쟁력이 됩니다.

무중단 배포

무중단 배포는 서비스 장애와 배포의 부담을 최소화하기 위해 운영 중인 서비스를 중단하지 않고 신규 소프트웨어를 배포하는 기술입니다. 무중단 배포의 핵심은 로드밸런서(Load Balancer)를 통해 연결된 두 개 이상의 (서로 다른 IP, 포트를 가진) 인스턴스에 트래픽을 제어해 배포하는 것입니다. 배포 작업이 서비스에 영향을 주지 않도록 하기 위해 고객의 이용량에 따라 인스턴스는 물론 로드밸런서도 다중화를 고려해야 합니다. 즉, 무중단 배포를 하기 위해서는 고가용성의 시스템 인프라가 구성되어 있어야 합니다.

    Client, Load Balancer, Instance 1, Instance 2, Instance 3 [그림 1] 무중단 배포 기본 구성

무중단 배포는 크게 두 종류로 나뉩니다. 제한된 자원에서 하나씩 배포하여 변경해 나가는 롤링 배포 방식과 현재 사용 중인 버전의 인스턴스 수만큼 새 버전의 인스턴스를 준비해 로드밸런서가 스위칭해주는 블루-그린 배포 방식이 그것입니다. 여기에 더해 새 버전 소프트웨어의 모니터링과 검증에 초점을 맞춘 카나리 배포 방식도 빼놓을 수 없습니다. 이들 세 가지 방식에 대해 좀 더 자세히 알아보겠습니다.

1) 롤링 배포(Rolling Deployment)

롤링 배포는 사용 중인 인스턴스 내에서 새 버전을 점진적으로 교체하는 것으로 무중단 배포의 가장 기본적인 방식입니다. 서비스 중인 인스턴스 하나를 로드밸런서에서 라우팅하지 않도록 한 뒤, 새 버전을 적용하여 다시 라우팅하도록 합니다. 이를 반복하여 모든 인스턴스에 새 버전의 애플리케이션을 배포합니다. 인스턴스마다 차례로 배포를 진행하기 때문에 상황에 따라 손쉽게 롤백(Roll Back)이 가능한 장점이 있습니다. 롤링 배포 방식은 가용 자원(인스턴스)이 제한적일 경우에 사용되며 새 버전을 배포할 때 인스턴스 수가 감소하기 때문에 서비스 처리 용량을 고려해야 합니다. 또한 배포가 진행되는 동안 구버전과 신버전이 공존하기 때문에 호환성 문제가 발생할 수 있습니다.

    단계 1(배포 전): Old Version, 단계 2: Old Version, New Version, 단계 3: Old Version, New Version, 단계 4(배포 후): New Version [그림 2] 롤링 배포

2) 블루-그린 배포(Blue-Green Deployment)

블루를 구버전, 그린을 신버전으로 지칭하여 붙여진 이름으로 운영 환경에 구버전과 동일하게 신버전의 인스턴스를 구성한 후, 로드밸런서를 통해 신버전으로 모든 트래픽을 전환하는 배포 방식입니다. 구버전과 동일한 운영 환경으로 신버전의 인스턴스를 구성하기 때문에 실제 서비스 환경에서 신버전을 미리 테스트 할 수 있는 장점이 있고 롤링 배포와 마찬가지로 빠른 롤백이 가능합니다. 배포가 완료된 후 남아 있는 기존 버전의 환경을 다음 배포에 재사용할 수 있습니다. 하지만 블루-그린 배포를 위해서는 시스템 자원이 두 배로 필요하며 새로운 환경에 대한 테스트가 전제되어야 합니다.

    배포 전: Client, Load Balancer, Old Version, New Version, 배포 후: Client, Load Balancer, Old Version, New Version [그림 3] 블루-그린 배포

3) 카나리 배포(Canary Deployment)

옛날 광부들이 유독 가스에 민감한 카나리아 새를 이용해 가스 누출 위험을 감지했던 것에서 유래한 것으로 잠재적 문제 상황을 미리 발견하기 위한 방식입니다. 신버전의 제공 범위를 늘려가면서 모니터링 및 피드백 과정을 거칠 수 있습니다. 로드밸런서를 통해 신버전의 제품을 경험하는 사용자를 조절할 수 있는 것이 특징으로 신버전을 특정 사용자(예: 모바일 이용자) 혹은 단순 비율에 따라 구분해 제공할 수 있습니다. 이 방식은 신버전의 배포 전에 실제 운영 환경에서 미리 테스트한다는 점이 블루-그린 배포와 비슷합니다. 하지만 카나리 배포는 단계적인 전환 방식을 통해 부정적 영향을 최소화하고 상황에 따라 트래픽 양을 늘리거나 롤백할 수 있습니다. 단, 롤링 배포와 마찬가지로 신·구 두 버전이 운영되기 때문에 버전 관리가 필요합니다.

    Client, Load Balancer, 90% Old Version, 10% New Version / Client, Load Balancer, 10% Old Version, 90% New Version / Client, Load Balancer, 100% New Version [그림 4] 카나리 배포

마치며

아마존, 구글, 페이스북 등 빅테크 기업이 운영하는 대형 서비스의 경우 하루에만 1,000회 이상 배포가 이뤄지고 있습니다. 배포가 잦다는 것은 그만큼 고객의 요구를 충족시키고 있음을 의미합니다. 이제 필요할 때 즉각적인 배포가 가능한 체제를 갖추는 것은 기업의 역량 척도이자 서비스를 더 빨리 성장시킬 수 있는 중요한 요인이 되었습니다. 다행스럽게도 컨테이너(Container) 환경이 확산하면서 자동화된 배포 시스템 구축을 지원하는 다양한 도구들이 존재합니다. 따라서 서비스 규모와 사용자 유형에 적합한 배포 전략을 구사하기가 한결 쉬워졌습니다.

무중단 배포를 이용해 신규 기능을 안정적으로 제공하길 바랍니다. 시장과 고객의 요구에 빠른 대응이 가능해지면서 보다 경쟁력 있는 서비스를 만들 수 있을 것입니다.

# References
[1] https://newrelic.com/blog/best-practices/data-culture-survey-results-faster-deployment
[2] https://imgur.com/a/3uBZKBN
[3] https://blog.banksalad.com/tech/become-an-organization-that-deploys-1000-times-a-day/
[4] https://dev.to/mostlyjason/intro-to-deployment-strategies-blue-green-canary-and-more-3a3



▶  해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶  해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.


공유하기 열기
김지명
김지명 클라우드 전문가

에스코어㈜ 소프트웨어사업부 오픈소스SW그룹

오픈소스 소프트웨어의 기술 서비스를 담당하고 있습니다.