진짜 같은 가짜를 만들어 내는 인공지능 기술, GAN!

GAN

삼성SDS 연구소에서는 새로운 기술에 대한 임직원 역량을 강화하고, 향후 기술 개발과 사업에 적용 할 수 있는 Insight를 얻기 위해 매월 TechTonic 행사를 개최하고 있는데요. 2015년 시작된 TechTonic은 회사 내·외부 전문가를 초빙해 기술에 대해 심도 있는 강의와 토론을 진행하는 월례 행사입니다. 그동안 사물 인터넷과 딥러닝, 핀테크, Robotics, 보안 기술 등 IT Trend에 대한 전반을 다뤘는데요. 뜨거웠던 이번 TechTonic 현장 속으로 다 같이 가보실까요?

‘진짜 같은 가짜를 만들어 내는 새로운 인공지능 기술, GAN(Generative Adversarial Networks)’이 2018년 첫 TechTonic 주제로 선정됐습니다. GAN은 상반된 목적을 가진 ‘만드는 사람(Generator)’과 ‘구별하는 사람(Discriminator)’이 서로 경쟁하는 AI(Artificial Intelligence) 학습 기법인데요. 최근 딥러닝에서 가장 화두가 되고 있는 GAN의 개념과 사례를 중심으로 강연이 진행됐습니다.

# 지도 학습(Supervised learning) 과 비지도 학습(Unsupervised learning)
GAN 개념과 원리를 강의한 한양대학교 장준혁 교수는 GAN 기술 이해를 위해 딥러닝의 기술 변화와 학습법을 설명했습니다. 음성과 이미지, 자연어 처리, 바이오 등 다양한 분야로 빠르게 확장되고 있는 딥러닝은 지도 학습, 비지도 학습, 강화 학습 등 세 가지 학습법으로 구분할 수 있는데요. 지도 학습(Supervised learning)은 정답을 알려주고 학습하는 방법으로 음성, 영상 인식 등 현재의 대부분의 딥러닝 기술은 이 방법을 사용한다고 합니다.

반면 최근 많은 주목을 받고 있는 것은 비지도 학습(Unsupervised learning)인데요. GAN도 이 비지도 학습에 속합니다. 비지도 학습은 정답을 알려주지 않고 학습하는 방법으로 자막 없이 영어를 들으며 공부하는 것과 같은 원리인데요. A, B, C를 하나씩 구별해주고 학습하는 지도학습에 비해 어려운 기술이지만, AI가 스스로 대량의 데이터를 분류하게 되면 파급 효과와 적용 분야가 훨씬 큰 학습법이라 할 수 있습니다.

장준혁 교수 ▲GAN 개념과 원리를 강의한 한양대학교 장준혁 교수

# 경찰과 위조지폐 제작자의 대결로 성장하는 GAN
본격적인 GAN 기술을 위해 장준혁 교수는 ‘Generator(만드는 사람)’와 ‘Discriminator(구별하는 사람)’를 설명했습니다. 쉽게 말해 Generator는 진짜 같은 가짜를 만들어 Discriminator를 속이도록 학습하며, Discriminator는 Generator의 속임수에 넘어가지 않고 가짜와 진짜를 구분하도록 학습합니다. 이 과정에서 Generator는 최대한 실제 데이터와 유사하게 가짜 데이터를 생성하려 하고, Discriminator는 데이터를 비교해 가짜를 구별하려고 경쟁 학습하는데요. 데이터 자체에서 지식을 얻는 이 비지도 학습은 다양한 분야에 적용될 수 있습니다.

Generator와 Discriminator ▲Generator와 Discriminator 역할

GAN 기술 ▲그림으로 보는 GAN 기술

# 실제 적용된 분야는?
그럼 GAN 기술은 어디에 쓰일 수 있을까요? 장준혁 교수는 요즘 이슈가 되고 있는 AI 스피커 기술을 예로 들었는데요. AI 스피커는 사용자의 음성을 바르게 인식하고 이를 실행으로 옮겨야 제대로 작동한다고 할 수 있습니다. 하지만 잡음과 생활 소음 때문에 인식률이 저하될 수 있는데요. 여기서 GAN을 이용해 음성 인식률을 높일 수 있습니다.

먼저 잡음이 섞인 Noise speech를 Generator에게 학습시켜 정교한 가짜 데이터를 만들게 합니다. 또한, Discriminator가 Clean speech(사용자 음성)를 진짜 데이터로 인식해 학습하게 하고, 이와 다른 것은 가짜로 구별하게 합니다. 이 과정에서 Discriminator는 Generator가 만든 정교한 가짜 데이터를 계속 구별하고 과정이 반복될수록 AI 스피커는 사용자 음성을 제대로 알아듣게 됩니다.

서울대학교 조형주 연구원은 다양한 GAN의 Variants와 그 사례를 소개했는데요. 그 동안 암세포의 진단을 위해 병원마다 각기 다른 색의 염료를 사용해 학습을 통한 암세포 구별에 장애가 있었는데요. GAN 기술을 활용해 염료의 색에 영향을 받지 않는 Stain Style Transfer 모델을 개발하여 암세포 구별의 정확도를 높였습니다.

조형주 연구원 ▲GAN의 다양한 사례를 소개한 서울대학교 조형주 연구원

AI 분야 대가로 꼽히는 앤드류 응은 미래 딥러닝을 이끌 기술로 GAN과 같은 비지도 학습을 꼽았는데요. 기술 구현이 어려운 만큼 다양한 분야에 적용되면 그 파급효과가 더 클 것이라 예상합니다. 그럼 GAN이 가져올 변화를 기대하면서 기사를 마칩니다.

기자단 10기