인공지능을 만드는 인간 - 지금 주목할 인공지능 업계 NEW리더들

2024-04-11 임재완 작가

최근 음악계에서는 놀라운 소식이 들렸습니다. 핀란드 출신의 지휘자 클라우스 메켈레가 미국를 대표하는 교향악단 시카고 심포니 오케스트라의 리더로 임명되었다는 소식입니다. 해외 언론들은 이를 크게 다루며 큰 관심을 보였는데, 그 이유는 클라우스 메켈레가 1996년생인 20대이기 때문입니다. 이전까지 시카고 심포니의 지휘자는 82세의 리카르도 무티 등 대부분 음악계에서 오래 활동한 거장들이었습니다. 그래서 133년 전통의 시카고 심포니를 이끄는 리더에 20대가 선정되었다는 소식은 충격적이면서도 신선하게 다가왔습니다.

이처럼 신선한 파장은 음악계 뿐 아니라 인공지능 업계에서도 화두가 되고 있습니다. 새로운 리더들은 왕성한 혈기와 최신 인공지능 기술로 무장한 채 기존 인공지능 기업들과 때론 경쟁을, 때론 협력을 이어가며 업계의 시선을 끌고 있습니다. 본 리포트에서는 데이터, 모델, 오픈 소스 등 인공지능 파이프라인의 각 분야에서 2024년초 현재 괄목할만한 성과를 보이는 NEW 리더 3명을 살펴보도록 하겠습니다.

1) Scale AI 창업자 - 알렉산더 왕(Alexandr Wang)

인공지능 업계를 리드하는 NEW 리더 첫 번째로 살펴볼 인물은 Scale AI 창업자 알렉산더 왕(Alexandr Wang, 이하 알렉산더)입니다. 2024년 3월 현재 130억 달러에 달하는 가치 평가를 받는 Scale AI는 인공지능 모델의 성능 향상을 위한 데이터 처리에 집중하는 기업으로 OpenAI가 GPT 3.5의 미세 조정(fine tuning)을 위해 우선 파트너(preferred partner)로 선정한 주인공입니다. 또한 미국 국방부가 군사 목적으로 개발한 생성형 인공지능의 테스트와 평가를 담당하는 업체로 꼽히기도 했습니다.

일반 기업들이 GPT 3.5 모델을 활용해 각자의 분야에 적합한 LLM을 고도화하는 과정에는 고품질의 라벨링 데이터가 중요한데 Scale AI가 다양한 산업 분야를 위한 라벨링 데이터를 제공하는 것입니다. 이미지나 비디오 데이터의 경우, 컴퓨터 비전 기술을 사용하여 객체 인식, 세그멘테이션(segmentation), 포즈 추정(pose estimation) 등을 수행합니다. 텍스트 데이터에는 자연어 처리 기술을 적용하여 문장 구조 분석, 감정 분석, 키워드 추출 등을 자동으로 처리합니다. 또한 기업의 기밀 데이터를 사용하여 모델을 미세 조정하는 업무에도 데이터 보안과 프라이버시 보호가 상당히 중요합니다. Scale AI는 고객들의 데이터를 안전하게 처리하고 보호할 수 있는 체계 또한 갖추고 있습니다. 데이터 품질, 다양성, 보안성 등 인공지능 파이프라인의 주요 측면을 Scale AI가 담당하는 것입니다.

알렉산더가 Scale AI를 창업하게 된 배경에는 그의 대학 시절 에피소드와 관련이 있습니다. MIT 재학생이었던 알렉산더는 자신의 룸메이트가 기숙사 냉장고에서 자신의 요거트를 훔쳐가는 것으로 의심되는 상황에 큰 스트레스를 받았습니다. 그래서 냉장고에 카메라를 설치해 요거트가 사라지면 알람을 주도록 하고 싶었습니다. 인간의 관점에서는 매우 간단한 인공지능 시스템이었던 것입니다.

그런데 이 인공지능 시스템 개발 과정은 순탄하지 않았고 알렉산더가 창업의 동기를 갖게 되는 계기가 되었습니다. 일단 요거트가 어떻게 생겼는지 시스템에 알려줘야 했으며, 요거트처럼 포장된 비슷한 외관의 물건이 많아 요거트가 아닌 물건은 어떤 외관이어야 하는지, 냉장고 어느 칸에 요거트가 위치하고 있는지 등을 시스템에 알려줄 필요가 있었습니다. 알렉산더는 이 간단한 일을 자동화하는데 예상 외로 상당한 노력이 필요하다는 것을 배웠고 특히 Scale AI가 전문성을 보이고 있는 ‘세부 라벨링’의 중요함을 이 과정에서 깨닫게 됩니다. 라벨링이 잘못되면 이미지 인식과 그에 따른 판단이 부정확하게 된다는 기술적, 사업적 문제점을 찾은 것입니다.

1997년생인 알렉산더는 어릴 때부터 기술에 대한 실력이 남달랐습니다. 10대 때 이미 Q&A 플랫폼 서비스 Quora에서 소프트웨어 엔지니어로 일했으며 MIT에서 컴퓨터공학과 수학을 전공하던 중 2016년 ScaleAI를 창업하기 위해 학업을 중단합니다. 성과를 인정받아 알렉산더는 2021년 Forbes 매거진이 Enterprise Technology 분야 젊은 사업가 30인에 꼽혔고 2023년 타임지가 선정한 인공지능 분야 주요 인물 100인 중 한 사람으로 언급되기도 했습니다.

2) Anthropic 창업자 - 다리오 아모데이(Dario Amodei)

Anthropic 창업자 다리오 아모데이(출처 : Anthropic)

알렉산더 왕이 인공지능 파이프라인 중 데이터 분야에서 주목할 리더라면 두 번째 리더는 모델 특히 초거대언어모델 시장에서 두각을 나타내는 Anthropic의 창업자 다리오 아모데이(Dario Amodei,이하 다리오)입니다. 다리오는 프린스턴 대학교에서 물리학으로 학사 학위를, 스탠퍼드 대학교에서 물리학 박사 학위를 취득했습니다. 입자 물리학과 우주론이 그의 주요 연구 분야였는데 졸업 이후 인공지능으로 방향을 바꿔 바이두와 구글(Google Brain)을 거쳐 OpenAI의 Safety 팀 리더를 맡는 커리어를 쌓았습니다.

다리오 아모데이가 2016년 Future of Life Institute와 가진 인터뷰에 따르면 그는 구글에 재직하며 인공지능 모델 중 주변 환경과의 상호 작용이 중요한 강화학습(reinforcement learning)의 안전성에 흥미를 느꼈다고 합니다. 일반적으로 강화학습은 로보틱스, 자율주행차 등에 쓰이며 구글이 데이터 센터의 전력 운용에도 활용하는 학습법입니다. 강화 학습이 물리적 상호 작용과 관련 있는 디바이스 혹은 시스템 구축에 쓰이므로 다리오는 안전하고 신뢰할만한 성능을 보이는 것이 중요할 뿐 아니라 부정적 이벤트를 예방하는 방법까지도 고민하게 되었습니다.

참고로 Future of Life Institute는 테크 기술이 갖을 수 있는 위험성을 알리고 관련 프로젝트를 후원하는 기관입니다. 2023년 이 기관은 전세계 인공지능 관련 기업과 연구소를 대상으로 고성능 인공지능 개발 실험을 6개월간 멈추고 안정성을 리뷰하는 시간을 갖자는 내용의 ‘Pause Giant AI Experiments: An Open Letter’라는 제목의 성명을 발표한 곳이기도 합니다. 일론 머스크, 스티브 워즈니악, 에반 샤프 등이 이 성명에 공개 서명을 했습니다.

인공지능의 안정성에 대한 다리오의 관심과 열정은 ‘Concrete Problems in AI Safety’ 라는 제목의 논문으로 구체화 되었습니다. 이 논문은 청소 로봇의 예를 통해 인공지능 시스템의 부작용 예방책을 고민하는데 필요한 5가지 포인트를 예시 질문과 함께 다음처럼 나열하고 있습니다.

※ (청소 로봇의 예로 살펴본) 인공지능 시스템의 부작용 예방책을 위한 5가지 포인트
1. 부작용 방지(Avoiding negative side effects) : 청소 로봇이 주어진 목표를 달성하면서 동시에 주변 상황에 부정적인 영향을 끼치지 않도록 할 것인가?
2. 보상 해킹 방지(Avoiding regard hacking) : 청소 로봇이 청소를 잘 하면 보상을 받게 되어 있다. 그런데 청소 로봇이 보상을 더 잘, 더 자주 받기 위해 보상을 주는 체계 자체를 속이거나 해킹하게 되면 어떻게 할 것인가?
3. 확장성 있는 감독(Scalable oversight) : 정보가 부족한 상황에서도 어떻게 하면 청소 로봇이 주어진 목표 즉 깨끗한 청소를 할 수 있도록 할 것인가?
4. 안전한 탐색(Safe exploration) : 청소 로봇이 부정적 결과를 초래할 수 있는 탐색을 하지 않도록 어떻게 만들 수 있을까? 예를 들어 청소 로봇은 물걸레질을 성공적으로 하기 위한 안전한 탐색을 해야 하지만 전기 콘센트에 젖은 물걸레를 넣는 것은 매우 위험한 탐색이다.
5. Distributional shift에 대한 강인함(Robustness to distributional shift) : 훈련 데이터와 시험 데이터의 분포 차이로 인해 시험 데이터의 성능이 낮아지는 이른바 distributional shift 현상을 고려할 때, 청소 로봇이 어떻게 하면 훈련 받은 환경과 다른 환경에서 어떻게 하면 안전한 성능을 보일 것인가?

다리오는 인공지능 모델의 안정성 뿐 아니라 ‘Deep Speech 2: End-to-End Speech Recognition in English and Mandarin’라는 제목의 논문을 통해 음성 인식 모델 성능을 향상하는 연구를 리드하기도 했습니다. 제목에서 드러나듯 영어와 만다린어 발화(speech)를 인식하는 딥러닝 모델에 대한 이 연구는 Deep Speech 2라는 이름의 end-to-end 모델 즉 단일 뉴럴 네트워크 아키텍처를 제안했습니다. End-to-end 모델은 특정 분야에 대한 데이터 없이 학습 데이터 자체만으로 관련 시스템 구축을 위한 학습이 가능하지만 그만큼 특정 분야 지식을 학습하기 위해서는 다량의 데이터가 필요합니다. 그럼에도 다리오의 연구는 소음이 많은 환경, 사투리 및 다른 언어를 포함한 다양한 유형의 발화를 처리할 수 있었으며 HPC(High Performance Computing)기술을 적용해, 기존 시스템보다 7배 빠른 속도 향상을 보였음을 보고하고 있습니다. 이는 인간과 거의 비슷한 수준의 인식 성능을 보여주는 결과입니다.

이처럼 인공지능 안정성과 성능을 동시에 고려하는 다리오의 관심은 2021년 Anthropic 창업에도 그대로 이어집니다. 최근 Claude 3라는 이름의 초거대언어모델을 공개한 Anthropic은 뛰어난 성능 뿐 아니라 안전한 인공지능 시스템 개발을 목표로 하는데, 특히 해석과 제어가 가능하며 신뢰할 수 있는 인공지능 모델을 목표로 하고 있습니다. 그래서 업계에서는 OpenAI에 견줄 수 있는 몇 안되는 AI 스타트업으로 주목하고 있습니다. Anthropic은 기술력과 가능성을 인정받아 2023년 9월, 아마존으로부터 40억 달러 투자를 이끌었으며, 아마존 웹 서비스(AWS)를 주요 클라우드 제공업체로 사용하고 AWS 고객들에게 Anthropic의 인공지능 모델을 제공하게 되었습니다. 또한 구글로부터도 약 20억 달러 규모 펀딩을 받는 등 무서운 성장세를 보여주고 있습니다.

3) Hugging Face 최고 과학자 - 토마스 울프 (Thomas Wolf)

Hugging Face 최고 과학자 토마스 울프 (출처 : Hugging Face)

지금까지 인공지능 분야의 주목할 리더로 데이터 분야에서 ‘알렉산더 왕’, 모델 분야에서 ‘다리오 아모데이’를 살펴보았습니다. 세 번째 주목할 인물은 인공지능 엔지니어라면 누구나 방문하게 되는 플랫폼 허깅 페이스(Hugging Face)의 공동 창업자이자 최고 과학자(Chief Science Officer)인 토마스 울프(Thomas Wolf, 이하 토마스)입니다.

‘The AI community building the future’ 라는 슬로건과 귀여운 노란색 스마일 아이콘으로 유명한 허깅 페이스는 인공지능 관련 최신 오픈 소스(open source) 코드와 데이터를 기반으로 사용자가 머신 러닝 모델을 구축, 훈련 및 배포할 수 있게 하는 도구와 환경을 제공합니다. Transformer라 불리는 멀티 모달 자연어 처리 모델과 프레임워크도 제공하고 있습니다. 그래서 허깅 페이스는 인공지능 엔지니어들이 모여 아이디어를 공유하고 오픈 소스 프로젝트에 참여할 수 있는 커뮤니티이자 저장소입니다. 덕분에 허깅 페이스 사용자들은 다른 사람들의 오픈된 소스 코드와 데이터를 활용하는 것은 물론 자신의 성과물을 알리고 실력을 공개적으로 검증받기도 합니다.

그런데 허깅 페이스의 브레인이라 할 수 있는 토마스는 컴퓨터 과학 분야를 전공하지 않은 인물입니다. 토마스는 프랑스 소르본 대학에서 양자 통계 물리학 박사 학위를 받았으며, 초전도 물질에 대한 연구를 주로 했습니다. 이후 다시 법학으로 커리어를 전환하여 법학 학위를 받고 5년 동안 특허 변호사로 일한 경력이 있습니다. 그는 2015년경 변호사로 일하며 많은 스타트업들을 만났는데 대부분 딥러닝 작업을 하고 있다는 사실을 발견했습니다. 그리고 딥러닝의 기저에는 자신이 전공했던 물리학에 쓰이는 수학과 비슷한 지식이 깔려 있음도 깨닫게 되었습니다.

이렇게 다소 특이한 과정을 거쳐 토마스는 딥러닝에 관심을 갖게 되었고 변호사에서 인공지능 분야로 커리어 전환을 하게 됩니다. 인상적인 것은 변호사에서 인공지능 분야로 커리어 전환 후에도 2019년부터 열정적으로 우수한 자연어 처리(NLP) 관련 인공지능 연구를 해오고 있다는 점입니다. 그의 Google Scholar 페이지와 개인 홈페이지에서 역대 논문과 인용 지수를 볼 수 있습니다.

토마스가 허깅페이스에서 이룬 대표적 성과물로는 트랜스포머(Transformer)를 들 수 있습니다. 허깅 페이스의 트랜스포머(Transformers) 라이브러리는 자연어 처리 (NLP) 분야에서 혁신적인 역할을 하고 있는 오픈 소스 라이브러리입니다. 이 라이브러리는 다양한 트랜스포머 기반 모델 (예: BERT, GPT-2, GPT-3, T5, XLNet 등)을 쉽게 사용할 수 있도록 지원하며, 파이썬 프로그래밍 언어로 작성되어 있습니다.

앞서 언급했듯 토마스와 허깅 페이스는 인공지능 연구 및 개발에 있어 오픈소스 접근 방식의 중요성을 강조하며, 트랜스포머를 비롯한 다양한 모델과 도구를 오픈소스로 제공하고 있습니다. 이러한 노력은 인공지능 연구자와 엔지니어가 최신 인공지능 기술에 쉽게 접근하고 활용할 수 있도록 함으로써 인공지능 분야 전체의 발전에 큰 기여를 하고 있습니다.

마치며

지금까지 데이터, 모델, 오픈소스 등 각 인공지능 파이프라인에서 괄목할만한 성과를 만들어 내고 있는 대표적인 NEW 리더들을 살펴봤습니다. 기술 뿐 아니라 비즈니스, 연구 등의 분야에서 균형감 있는 활약을 보여주는 그들의 열정과 집념이 인상적입니다. 특히 꼭 컴퓨터 과학 뿐 아니라 물리학, 법학 등 다양한 학문적 배경을 하고 있다는 점도 눈길을 끕니다. 생성형 AI 등 최근의 인공지능 기술은 전통적인 딥러닝 지식에 기반해 무서운 발전 속도를 보여주고 있는만큼 새롭게 떠오르는 리더들의 역할이 중요합니다.

끝으로, 분량상 본 리포트에 담지 못했지만 구글 회장을 지낸 에릭 슈미트가 세운 자선 단체 Schmidt Futures도 뛰어난 인공지능 학자를 뽑은 ‘AI2050 Early Career Fellows’를 발표했습니다. 이 프로그램은 세계 주요 대학에서 사회에 긍정적인 영향을 줄 수 있는 인공지능 연구를 수행하는 학자들을 지원합니다. 다음 링크에서 Schmidt Futures가 선정한 그들의 자세한 활약과 정보를 볼 수 있습니다.
▷ 링크 바로 가기

참고자료
[1] https://scale.com/about
[2] https://openai.com/blog/openai-partners-with-scale-to-provide-support-for-enterprises-fine-tuning-models
[3] https://www.anthropic.com/company
[4] Amodei, D., Olah, C., Steinhardt, J., Christiano, P., Schulman, J., & Mané, D. (2016). Concrete problems in AI safety. arXiv preprint arXiv:1606.06565.
[5] Amodei, D., Ananthanarayanan, S., Anubhai, R., Bai, J., Battenberg, E., Case, C., ... & Zhu, Z. (2016, June). Deep speech 2: End-to-end speech recognition in english and mandarin. In International conference on machine learning(pp. 173-182). PMLR.

▶ 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶ 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.

이 글이 좋으셨다면 구독&좋아요

여러분의 “구독”과 “좋아요”는
저자에게 큰 힘이 됩니다.