2020년 전후로 지멘스와 GE를 비롯한 글로벌 제조 기업들은 디지털 트랜스포메이션 흐름 속에서 "공장을 똑똑하게 만든다"는 목표를 내걸고 스마트팩토리 투자를 본격화했다. 이 시기의 디지털 트윈은 공장의 현재 상태를 "가상 공간에 최대한 그대로 옮겨놓는 것"에 집중했다. 센서와 카메라로 수집한 데이터를 클라우드와 대시보드에 연결하고 3D 모델 위에 상태를 입혀서 설비·라인·물류·인력을 한 화면에 보여주는 방식이었다. 그러나 여기에는 구조적 한계가 있었다. 공장을 가상으로 복제해 보여주는 것과 그런 가상 공장을 이용해 "왜 이런 일이 발생했는지"를 해석하고 "무엇을 어떻게 바꿔야 하는지"를 찾아 "현장에 안전하게 적용"하는 것은 완전히 다른 차원의 문제였기 때문이다. 많은 현장에서 디지털 트윈은 '시각화가 뛰어난 모니터링 시스템'으로 성과를 내면서도 최적화와 자동 의사결정까지는 도달하지 못했다. 하지만, 2025년 본격화된 Physical AI와 VLA(Vision-Language-Action 모델) 그리고 월드모델 기반 시뮬레이션이 산업 현장에 적용되기 시작하면서 변화가 모색되고 있다. 제조 현장에서 휴머노이드 로봇을 배치하는 움직임도 자동차 공장과 물류센터로 확산되고 있고 이를 돕는 시뮬레이션과 로봇 학습 플랫폼이 빠르게 정비되는 중이다. 화이트컬러 사무직 직장인을 돕는 ChatGPT나 생성형 AI를 넘어 이제 블루컬러 공장 노동자들을 돕고 부분 대체하는 디지털트윈과 AI 팩토리, 로봇 등의 Physical AI에 주목해야 할 때다.
NVIDIA와 Siemens가 구현한 산업용 메타버스, 디지털 트윈
2020년대 초반 스마트팩토리의 출발점은 "보는 공장"을 만드는 일이었다. 이를 가능하게 한 것은 공장 전체를 계측하는 센서 네트워크와 OT-IT 데이터 통합 파이프라인이었다. 이를 위해 공장 내 설비 단에서는 설비 제어기(PLC)와 각종 계측 센서들을 대량으로 설치했다. 전력·온도·압력을 측정하는 기본 센서부터 설비 고장을 예측하는 진동·음향 센서 그리고 품질을 검사하는 머신비전 카메라와 자재, 작업자 위치를 추적하는 RFID, 실내측위 시스템 덕분에 공장 구석구석을 계측할 수 있게 되었다. 또한, 네트워크 단에서는 산업용 이더넷과 OPC UA 같은 상호운용 표준 그리고 시계열 데이터베이스와 엣지 컴퓨팅이 결합되면서 "현장의 신호를 디지털로 표준화해 동기화할 수 있는 길"이 열렸다.
이렇게 수집된 데이터는 대시보드에 실시간으로 표시되어 관리자는 설비 가동률, 정지 원인, 품질 이상, 에너지 사용, 병목 구간을 훨씬 빠르게 파악할 수 있게 됐다. 실제 지멘스 암베르크 공장은 MES와 설비 데이터를 촘촘히 연결해 하루 수억 건의 공정 데이터를 수집 분석해 공장의 상태를 고스란히 모니터링할 수 있다.
독일 지멘스의 암베르크공장 속 MES (출처: 하노버메세)
이같은 "보는 공장"은 실제 비즈니스 가치를 만들어주는데 기여하기도 했다. 슈나이더 일렉트릭의 중국 우시 공장은 5G와 협동로봇, AI 비전 검사, 공급망 데이터 통합을 결합해 출시 기간 25% 단축, 정시 납품 30% 개선이라는 성과를 냈다. 디지털 트윈을 이용해 냉난방 시스템을 최적화해 에너지 소비를 32% 개선했다는 수치도 공개되어 실질적인 가치를 만들어내었다.
슈나이더 일렉트릭 중국 우한 공장
더 나아가 이같은 공장의 시각화는 생산성 향상을 넘어 공장의 안전과 고장 예방에도 실질적인 효과를 만들었다. 5G 기반 실시간 센서 네트워크로 충돌 감지와 예방 정비를 강화한 사례들이 그것이다. 즉, 현장 노동자들이 일하는 과정에 사고를 실시간으로 분석하고 앞으로 벌어질 사건을 예측해서 미리 사고 예방을 할 수 있고, 공장의 각종 장비들의 작동 상태를 모니터링하면서 고장을 사전에 정비할 수 있었다. 즉, 공장의 시각화는 단순한 "보기 좋은 대시보드"가 아니라 연결성과 계측 범위를 넓히며 운영 리스크를 낮추는 실질적 성과를 만드는 것으로 이어졌다.
단, 이 단계의 디지털 트윈은 '기록과 관측'은 훌륭했지만 '처방과 개선'에는 약했다. 세 가지 이유가 있었다.
첫째, 설비·MES·ERP·품질 시스템 등 각기 다른 시스템들에서 수집된 데이터들을 일관된 의미로 해석하기 어려웠다.
둘째, 공정을 물리적으로 정확히 시뮬레이션하려면 설비 파라미터, 작업자 행동, 자재 편차까지 반영해야 하는데 이에 대한 투자 비용이 컸을 뿐 아니라 기술적으로 실현 불가능했다.
셋째, 최적화 결과를 현실에 적용할 때 안전·품질 리스크가 크기 때문에 알고리즘이 낸 답을 곧바로 실행하기 어려웠다. 이 때문에 2020년대 초반의 디지털 트윈은 많은 현장에서 '현실을 비추는 거울' 수준에 머무르는 한계가 있었다.
이런 분위기가 바뀌기 시작한 것은 2024년 이후 "언어-시각-행동"을 하나로 연결하는 시도가 본격화되면서다. 즉, 2023년 ChatGPT로 촉발된 LLM이 2024년 VLA(Virtual Language Action)로 이어지면서 로봇이 카메라로 본 장면과 사람의 지시를 함께 이해해 즉시 공장 내 장치의 구동으로 적용되는 것이 가능해진 것이다. 대표적인 VLA가 구글 딥마인드의 RT-2로 웹 규모의 시각·언어 사전학습 지식을 로봇 제어로 전이시키는 방법을 제시했다.
이 변화가 공장에 중요한 이유는 "프로그래밍으로 고정된 자동화"의 한계를 흔들기 때문이다. 기존 산업용 로봇은 반복 정밀 작업에는 압도적이지만 자재가 조금만 바뀌거나 공정이 자주 변경되면 티칭과 셀 재설계 비용이 폭증했다. 반면 VLA와 Physical AI는 현장 상황을 인지하고 작업 의도를 이해해 비교적 범용적인 조작·이동·검사·피킹 작업을 유연하게 처리한다. 이 흐름 덕분에 24시간 무인으로 작동되는 온전한 '다크 팩토리'의 구현에 대한 가능성이 열리고 있다.
가장 구체적인 첫 시작의 신호는 실제 공장 테스트다. BMW는 2024년 미국 스파턴버그 공장에서 Figure사의 휴머노이드 로봇 Figure 02를 실제 생산 환경에서 시험했다. 메르세데스-벤츠는 Apptronik의 Apollo를 제조 시설에서 시험하며 부품 키팅과 검사 같은 물류·품질 인접 업무를 시험했다. 이는 "라인의 핵심 조립"을 곧바로 무인화하기보다 사람이 하기 부담스럽거나 반복적인 주변 작업부터 자동화해 투자 대비 효과와 안전성을 확보하려는 현실적인 접근이다.
BMW 공장 속 피겨AI 로봇
테슬라는 "공장 내에서 쓸 휴머노이드"라는 상징성을 강하게 밀고 있다. 2026년 1월 보도에 따르면 3세대 Optimus를 1분기에 공개하고 생산 라인 준비와 대량 생산을 언급했다.(다만 일정은 변동 가능성이 크고 공개 데모 중 일부는 원격조작 논쟁이 있었다는 점도 지적된다.) 중국에서는 UBTECH의 Walker S 시리즈가 BYD 공장에서 작업하고 있으며 2026년 1월 에어버스와 항공 제조 분야 적용 계약을 발표했다. 자동차를 넘어 항공 제조로 실험이 확장되는 양상이다. 한국의 현대자동차 역시 보스턴다이내믹스 인수 이후 양산형 휴머노이드 ‘아틀라스’를 공장 자동화의 핵심 축으로 삼고 있다. CES 2026에서 공개된 계획에 따르면 현대차그룹은 2028년부터 연간 3만대 규모의 아틀라스 로봇을 양산해 미국 조지아 메타플랜트 아메리카(HMGMA)에 투입해 부품 라인 투입 순서관리와 파킹작업 등 물류·공정 보조에 활용하고 2030년까지는 고난도 부품 조립과 중량물 취급 등 핵심 조립 공정으로 역할을 확대하겠다는 목표를 제시했다.
중국 아우디 공장에 투입된 유비테크 워커 S1
이같은 "공장의 무인화, 자동화"에 대한 실현에 엔비디아도 가세했다. 엔비디아는 2024년 휴머노이드 로봇용 파운데이션 모델 'Project GR00T'를 발표했고 2025년에는 Isaac GR00T N1로 확장하면서 로봇 학습·시뮬레이션·데이터 생태계를 전면에 내세웠다. 또한 엔비디아는 Isaac 플랫폼과 옴니버스, 코스모스 등의 로보틱스·시뮬레이션 플랫폼을 발표해 차세대 AI 팩토리를 위한 솔루션을 발표했다. 이같은 기술은 휴머노이드 로봇 자체를 넘어, 이런 로봇들이 학습할 데이터와 안전하게 시험할 가상 환경, 현장 배치 후 지속적으로 개선하는 MLOps 체계를 아우르고 있어 보는 공장을 넘어 움직이는 공장의 현실화를 앞당기고 있다.
NVIDIA의 로봇 학습을 위한 Isaac 플랫폼
더 나아가 디지털 트윈이 시각화를 넘어 의사결정 시스템이 되려면 공장이 "대화 가능한 대상"으로 바뀌어야 한다. 여기서 LLM은 단순 챗봇이 아니라 공장 데이터·문서·표준작업절차·제약조건·시뮬레이션·최적화 엔진을 연결해 의사결정을 돕는 인터페이스이자 통합 제어자 역할을 해야 한다. 이 방향을 산업 솔루션으로 구현한 대표 사례가 'Siemens Industrial Copilot'이다. 마이크로소프트는 2024년 10월 지멘스와 협력해 Industrial Copilot을 제조·자동화 환경에서 확장한다고 밝혔고 지멘스는 2025년 3월 생성형 AI 기반 유지보수 솔루션 확장을 발표했다.
공장을 작업자가 copilot으로 대화하며 작동
여기서 중요한 변화는 "답을 보여주는 대시보드"에서 "조치를 설계하고 검증한 뒤 실행하는 순환 구조"로 무게중심이 이동한다는 점이다. 이를 단계로 정리하면 다음과 같은 시나리오가 가능해진다.
첫째 단계, 공장을 그대로 측정·모니터링해 가상에 옮기는 단계다. 이는 이미 많은 기업이 달성했다. 슈나이더 우시 공장처럼 공급망·현장 데이터를 통합하고 AI 검사와 디지털 트윈으로 납기·에너지 같은 운영지표를 개선하는 사례가 여기에 해당한다.
둘째 단계, 공장 상태를 파악한 다음 무엇을 실행해야 하는지까지 연결하는 단계다. 이 구간이 바로 Physical AI와 VLA가 들어오는 지점이다. 휴머노이드가 모든 것을 대체하는 방식이 아니라 키팅·내부물류·검사·재작업 같은 변동성이 큰 주변 공정부터 로봇이 흡수하면서 공장 전체 운영 방식이 바뀌기 시작한다. 폭스콘이 2026년 초 미국 휴스턴 AI 서버 공장에 휴머노이드 로봇을 배치하겠다고 밝힌 것은 "AI를 위한 공장에서 AI를 쓰는 공장으로의 전환"이라는 상징성이 크다. 이 계획은 엔비디아 Isaac GR00T를 활용하는 방향이다. 앞으로의 로드맵은 기업과 공정에 따라 다르겠지만 향후 3년 내에는 라인 핵심 조립보다 물류와 품질·안전 보조 작업에서 상용화가 빠르게 늘어날 가능성이 높다. 이유는 실전 사례(Use case)가 비교적 표준화돼 있고 안전 리스크를 통제하기 쉬우며 인력난과 교대근무 부담이 즉시 투자 효과로 직결되기 때문이다.
셋째 단계, 가상에서 시뮬레이션해 더 나은 공장으로 지속적으로 개선하고 그 결과를 다시 현실에 반영하는 "자기개선 순환"이다. 이때 필요한 것은 단순 3D 모델이 아니라 로봇과 공정이 학습할 수 있는 물리 기반 가상환경과 방대한 시나리오 데이터를 생성하는 월드 모델이다.(LWM = Large World Model) 엔비디아는 Omniverse를 산업용 디지털 트윈 시뮬레이션 플랫폼으로, Cosmos를 물리 AI용 월드 모델 플랫폼으로 제시하고 있다. Isaac Sim은 Omniverse 기반 로봇 시뮬레이션 프레임워크로 실제 배치 전 가상 검증과 합성 데이터 생성에 직접 연결된다.
이 "시뮬레이션-최적화-실행" 순환을 산업적으로 증명하는 대표 사례가 BMW의 디지털 공장 전략이다. BMW는 Omniverse를 이용해 공장 레이아웃, 로봇, 물류 시스템을 가상에서 검증·최적화하고 이를 글로벌 생산 네트워크로 확장한다. 이 방식이 의미 있는 이유는 공장의 변경 비용이 큰 현실에서 '가상에서 먼저 실패해보는 비용'이 압도적으로 싸기 때문이다.
엔비디아의 옴니버스를 이용해 BMW 공장의 최적 공정 프로세스와 공장 디자인을 재구성
마지막으로, 의사결정 시스템으로서 진화하는 디지털 트윈은 최적화 엔진과 결합될 때 완성도가 올라갈 것이다. 엔비디아는 의사결정 최적화 엔진 cuOpt를 공개하며 대규모 제약 최적화 문제를 가속하는 포지션을 잡고 있다. 제조 현장에서 이는 생산계획, 자재 흐름, 인력 배치, 무인운송 경로, 납기 우선순위 같은 문제를 "시뮬레이션과 함께" 풀어내는 기반이 된다.
정리하면 3년 후 공장은 자동화와 무인화 기반의 AI Factory(Dark Factory)로 그리고 5년 후는 "말하면 디지털 트윈이 시나리오를 생성하고, 시뮬레이션으로 검증하며, 솔루션을 제시하고, 필요한 작업 절차와 코드까지 제안하는 자율 공장"으로 진화할 가능성이 높다. 다만 이 전망이 실현되려면 데이터 거버넌스(정합성·계보·보안)와 안전(사람의 검증, 시뮬레이션 기반 사전 검증, 단계적 적용)이 필수 전제다. 이 전제가 무너지면 미래의 공장은 다시 "보기 좋은 대시보드"로 퇴행할 수밖에 없다.
▶ 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶ 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.
![]()
김지현 | 테크라이터
기술이 우리 일상과 사회에 어떤 변화를 만들고, 기업의 BM 혁신에 어떻게 활용할 수 있을지에 대한 관심과 연구를 하고 있습니다.