페북 인식, 구글 번역 "女 천문학자 덕분"
페북 인식, 구글 번역 "女 천문학자 덕분"
  • 함예솔
  • 승인 2020.04.20 17:15
  • 조회수 8206
  • 댓글 0
이 기사를 공유합니다

페이스북은 태그가 되어 있지 않은 사진에서 사진 속 이웃님의 친구가 누군지 알아냅니다. 구글 번역기는 한 언어를 문장으로 입력하면 다른 언어로 바꿔주죠. 오로지 숫자로만 생각하는 컴퓨터가 어떻게 이미지 같은 복잡한 데이터를 인지해 우리가 원하는 결과를 보여주는 걸까요?

구글 번역기는 어떻게 작동할까? 출처: AdobeStock
구글 번역기는 어떻게 작동할까? 출처: AdobeStock

패턴을 학습해 작동하는 AI

 

AI의 이러한 작업을 '이미지 분류'라고 합니다. AI가 이미지를 분류하는 방식은 '패턴'을 인식하는 능력 덕분인데요. 사람들은 패턴을 인식하는 데 매우 뛰어납니다. 예를 들어 우리는 말을 할 때 소리를 올바른 의미와 일치시키고 사람들의 얼굴을 누군가와 일치하는 법을 어릴 때부터 배우게 됩니다. 이와 마찬가지로 AI 역시 '패턴'을 학습할 수 있습니다.  

 

페이스북의 소프트웨어는 업로드한 사진 속 사람의 얼굴을 입력해 그 사람의 신원을 찾는데요. 이전에 올라왔던 사진 속의 어떤 사용자명과 일치하는지에 관한 패턴을 익혀 작동합니다. 구글 번역기 역시 영어를 한글어로 번역한다고 할 때 패턴을 이용합니다. 영어 문장을 입력하면 방대한 문장이 들어있는 데이터베이스를 거쳐 어떤 영어 문장이 어떤 한국어 문장과 일치하는지에 관한 패턴을 읽어냅니다. 즉, AI에게 패턴이란 입력된 정보를 예상되는 출력에 대응시키는 일종의 예측 규칙이라고 할 수 있습니다. 입력을 출력에 대응시키는 방정식인 셈이죠.

페이스북은 태그가 되어 있지 않은 사진에서 사진 속 친구가 누군지 알아낸다. 출처: AdobeStock
페이스북은 태그가 되어 있지 않은 사진에서 사진 속 친구가 누군지 알아낸다. 출처: AdobeStock

그런데 AI가 사용하는 예측 규칙이 어떻게 패턴을 알아챌 수 있는지 잘 보여주는 사례가 있습니다. 책 <수학의 쓸모>에 따르면 AI의 패턴 인식에 숨은 수학적 원리는 20세기 초 무명의 천문학자 '헨리에타 레빗'에서부터 시작됐습니다. 

 

우주의 크기를 재는 법 알아낸 헨리에타 레빗 

 

우주는 얼마나 클까요? 오늘날 우리는 허블 우주망원경이 찍어 놓은 경이로운 사진들만 보아도 우주가 굉장히 방대하다는 사실을 깨닫고 있는데요. 하지만 1924년까지만 해도 과학자들은 우리 은하가 우주의 유일한 은하라고 여겼습니다. 헨리에타 레빗이 수백만 광년의 거리까지 잴 수 있는 새로운 예측 규칙을 찾아내기 전까지는 말이죠. 

수백만 광년의 거리까지 잴 수 있는 새로운 예측 규칙을 찾아낸 헨리에타 레빗. 출처: AAVSO
수백만 광년의 거리까지 잴 수 있는 새로운 예측 규칙을 찾아낸 헨리에타 레빗. 출처: AAVSO

헨리에타 레빗은 하버드대학교 천문대의 수학 천재들의 모임인 '하버드 컴퓨터스(Havard Computers)'에서 망원경을 통해 얻은 데이터를 분석했는데요. 레빗의 주된 역할은 세계 최대 망원경들이 얻은 수천 건의 자료 영상들을 나열해 놓고 빛을 이루는 미세한 점들의 크기를 서로 비교하는 일이었습니다. 

한 맥동변광성의 밝기가 맥동하는 과정. 이 별은 밝다가 어두워지다가 다시 밝아지는 주기가 5.4일이다. 출처: 수학의 쓸모
한 맥동변광성의 밝기가 맥동하는 과정. 이 별은 밝다가 어두워지다가 다시 밝아지는 주기가 5.4일이다. 출처: 수학의 쓸모

그 중에서도 헨리에타 레빗은 밝기가 시간에 따라 매우 규칙적으로 변하는 별인 '맥동변광성(Pulsing Star)'에 큰 관심을 가졌습니다. 참고로 맥동변광성이란 태양보다 수 천배 더 밝으면서 별의 대기가 팽창과 수축을 반복해 밝아졌다 어두워지는 항성입니다. 레빗은 이 특이한 별과 관련된 데이터를 지속적으로 수집했습니다. 별 하나를 여러 날에 걸쳐 촬영했고 그렇게 얻은 사진들을 확대경과 작은 자로 자세히 측정하며 맥동변광성의 특징을 찾아냈는데요. 바로 시간에 따라 반복적으로 빛의 점이 커지다가 작아지는 현상이었습니다. 

우주의 크기, 나이 및 팽창률 계산하는데 사용하는 서페이드 변광성 맥동주기-밝기 관계를 보여주는 그래프. 출처:NASA / JPL-Caltech / Carnegie
우주의 크기, 나이 및 팽창률 계산하는데 사용하는 서페이드 변광성 맥동주기-밝기 관계를 보여주는 그래프. 출처: NASA / JPL-Caltech / Carnegie

1912년 레빗은 소마젤란성운의 25개의 맥동변광성 무리인 '세페이드변광성(Cepheid variable)'에 초점을 맞췄는데요. 이에 레빗은 별들은 전부 동일한 성단에 속해 있었고 그래서 이 별들은 지구로부터 전부 거의 똑같은 거리에 있다고 생각했습니다. 이에 레빗은 25개 별에 대한 맥동 주기(별이 밝아졌다가 다시 어두워지다가 다시 밝아지는데 걸리는 시간)과 별의 밝기를 측정했습니다. 그 결과 맥동 주기와 밝기 간의 관계를 밝혀냈는데요. 가장 어두운 별들은 주기가 일 단위인 반면 가장 밝은 별들은 주기가 월 단위였습니다. 즉, 주기가 길수록 별이 더 밝았던 겁니다. AI 관점에서 보자면 레빗은 예측 규칙을 발견한 셈이었습니다. 즉, '출력=입력의 함수'라는 간단한 공식을 사용해서 말이죠. 

별들 거리 알아낼 수 있는 우주의 줄자. 출처: NASA / JPL-Caltech
별들 거리 알아낼 수 있는 우주의 줄자. 출처: NASA / JPL-Caltech

1912년 레빗은 자신의 연구 결과를 세쪽자리 논문에 발표했다고 하는데요. 이 발견은 천문학자들이 찾고 있던 '우주의 줄자'였습니다. 천문학자 할로 섀플리(harlow Shapley)는 이 우주줄자를 이용해 가장 먼저 중대한 연구를 내놓았는데요. 은하수 안에 있는 여러 맥동변광성의 주기를 측정해 각 별들이 진짜 밝기를 알아냈던 거죠. 그리고 이 결과를 이용해 거리를 계산했고 우리 은하의 폭이 적어도 10만 광년이라는 결과를 내놓았습니다. 이는 당시 누구도 상상하지 못할 정도의 엄청난 수치였다고 합니다. 

허블 변광성(V1)으로 알려진 별은 안드로메다은하에서 찾은 첫번째 맥동변광성.  출처: NASA, ESA, and the Hubble Heritage Team (STScI/AURA)
허블 변광성(V1)으로 알려진 별은 안드로메다 성운에서 찾은 첫번째 맥동변광성. 출처: NASA, ESA, and the Hubble Heritage Team (STScI/AURA)

이후 그 유명한 천문학자, 에드윈 허블(Edwin Hubble)이 레빗의 예측 규칙을 이용해 안드로메다 성운 안에서 맥동 변광성을 찾기 시작했습니다. 그러다 1923년 10월 허블은 마침내 안드로메다 성운 안에서 맥동변광성 하나를 찾아냈습니다. 허블은 그 겉보기 밝기를 재서 맥동주기를 31.4일로 계산해냈는데요. 이 값을 레빗의 예측규칙에 대입해 실제 밝기를 얻어냈습니다. 그리고 겉보기 밝기와 실제 밝기를 이용해 지구에서 안드로메다 성운까지의 거리를 구해냈습니다. 안드로메다 성운은 지구로부터 100만 광년 이상 떨어져 있었습니다. 그리고 이는 안드로메다 성운 말고도 다른 은하가 무수히 많이 존재한다는 의미이기도 했습니다. 드디어 우주가 얼마나 큰지 사람들은 가늠할 수 있게 된 것이죠. 참고로 안드로메다 성운은 망원경이 발전하며 성운이 아닌 은하란 사실이 밝혀졌습니다.

 

AI의 예측규칙은 레빗의 예측 규칙의 더 정교한 버전일 뿐

 

이렇게 AI의 예측규칙은 레빗의 예측 규칙의 더 정교한 버전일 뿐이라고 합니다. AI에서 패턴 인식은 방정식을 데이터에 맞춘다는 의미입니다. 물론 이미지, 텍스트, 동영상 등의 대용량 데이터에서 나타나는 패턴은 복잡하기 때문에 AI는 훨씬 어려운 방정식으로 기술되긴 하겠지만 말이죠. 따라서 이러한 패턴 인식 시스템이 제대로 작동하려면 고용량의 컴퓨터 연산 능력과 많은 데이터가 필요합니다. 그리고 복잡한 입력으로부터 유용한 정보를 추출해내는 능력도 필요하죠. 이를 위해 지난 10년 동안 AI 전문가들은 '심층신경망(Deep Neural Network)' 기술을 향상시켜왔는데요. 이는 특수한 유형의 예측 규칙을 이용해 영상이나 영어 단어처럼 숫자가 아닌 입력으로부터 수치적인 특징을 추출하는 자동화 기술을 말합니다.

복잡한 입력으로부터 유용한 정보를 추출해내는 능력을 위해 지난 10년 동안 AI 전문가들은 ‘심층신경망(Deep Neural Network)’기술을 향상시켜왔다. 출처: AdobeStock
복잡한 입력으로부터 유용한 정보를 추출해내는 능력을 위해 지난 10년 동안 AI 전문가들은 '심층신경망(Deep Neural Network)' 기술을 향상 시켜왔다. 출처: AdobeStock

그런데, 이렇게 개발된 심층신경망에 레빗의 연구를 대입시켜보면 AI의 예측규칙은 레빗의 예측 규칙의 더 정교한 버전이라는게 더 잘 드러납니다. 

 

1단계: 사진의 밝은 부분은 밤하늘의 빛을 나타낸다
2단계: 별은 어둠에 둘러싸인 빛의 점이다.
3단계: 별의 밝기는 그 점의 크기와 세기다
4단계: 맥동변광성은 여러 사진에 걸쳐서 밝기가 규칙적으로 변하는 별이다.
5단계: 맥동변광성의 주기는 밝을때부터 시작해 어두워졌다가 다시 밝아지는데 까지 걸리는 시간이다. 

이렇게 다섯 가지의 시각적 개념을 순서대로 따라가다 보면 숫자가 하나 나옵니다. 바로 '맥동변광성의 주기'입니다. 이렇게 추출된 특징을 예측 규칙에 입력으로 사용할 수 있는 거죠. 즉, 맥동변광성에 관한 예측 규칙은 주기를 입력으로 하고 진짜 밝기를 출력으로 내놓는 것이죠. 래빗은 '5단계의 심층신경망'을 사용한 셈이죠.

 


##참고자료##

 

닉 폴슨,제임스 스콧, 수학의 쓸모(2020), 더퀘스트


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 충청남도 보령시 큰오랏3길
  • 법인명 : 이웃집과학자 주식회사
  • 제호 : 이웃집과학자
  • 청소년보호책임자 : 정병진
  • 등록번호 : 보령 바 00002
  • 등록일 : 2016-02-12
  • 발행일 : 2016-02-12
  • 발행인 : 김정환
  • 편집인 : 정병진
  • 이웃집과학자 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2016-2024 이웃집과학자. All rights reserved. mail to contact@scientist.town
ND소프트