인공지능, 그 맹점과 보완
인공지능, 그 맹점과 보완
  • 함예솔
  • 승인 2022.08.20 05:17
  • 조회수 3202
  • 댓글 0
이 기사를 공유합니다

 

출처: Adobe Stocks

 

우리는 휴대 가능한 '기계 지능'에 익숙해졌습니다. 이제 우리는 '몸이 있고 스스로 움직이는 지능'에 익숙해져야 합니다.

-마누엘라 벨로소(Manuela Veloso) 카네기멜론대학 기계학습학과 교수-

 

인공지능(AI)은 알고리즘과 기술 측면에서 초기 단계 국면을 벗어나는 중입니다. 단순히 그 기술 자체가 주목받았던 초기를 지나 이제 인간과 인공지능이 서로를 필요로 하는 국면에 접어든 것이죠. 카네기멜론대학의 로봇공학자 마누엘라 벨로소(Manuela Veloso) 교수는 "미래에는 인간에게 인공지능이 필요한 만큼 인공지능 시스템도 인간을 필요로 할 것"이라고 말합니다.

빅데이터 및 인공지능 기술의 발전으로 구글, 애플, 마이크로소프트 등 클라우드 서비스를 제공하는 기업들은 전 세계 수십억 명의 사용자들에게 AI 기술을 기반 서비스를 제공 중입니다. 이를 '머신러닝 애즈 어 서비스(ML-as-a-Service, MLaaS)'라고 부릅니다. 대표적으로 유튜브나 페이스북 등에서 시청자의 개별 취향에 맞춰 동영상 콘텐츠나 상품 등을 추천하는 '개인화 추천 시스템 기술(Deep Learning Recommendation Model)', 구글 포토(Photo)와 애플 아이클라우드(iCloud) 등에서 사진을 인물 별로 분류해주는 '안면 인식 기술(Convolutional Neural Network based Face Recognition)' 등이 대표적입니다.

이 기술을 고안하고 실행을 명령하는 건 인간지능입니다. 명령을 받아 수행하는 건 인공지능입니다. 이 인공지능을 비약적으로 진화시킨 기술이 바로 딥러닝(Deep-learning)인데요. 글로벌 데이터 플랫폼 스태티스타에 따르면 딥러닝 기술이 특히 중요한 이유는 인간이 인풋을 주기 위해 수동 개입할 필요가 없는 첫 번째 알고리즘이기 때문입니다.

AI 기반 서비스는 사용자의 정보를 대량으로 수집해, 이를 기반으로 인공지능 알고리즘의 정확도와 성능을 개선합니다. 딥러닝 기술이 AI가 스스로 데이터를 수집하고 학습해 이를 문제를 개선해줍니다. 구글은 가장 방대한 데이터를 보유했습니다. 컴퓨팅 기술도 타의 추종을 불허합니다. 구글의 딥러닝 기술이 다른 머신러닝(machine learning) 기술보다 뛰어난 이유는 바로 그 초대형 인공지능 모델의 커다란 신경망이 점점 더 많은 데이터에 액세스 할 때 성능이 계속 향상된다는 점입니다. 다른 기술은 초기 단계에서 학습 능력이 정체되는 경우가 대부분입니다.

 

민감한 개인정보 유출의 한계

하지만 이 과정에서 필연적으로 많은 양의 사용자 정보가 서비스 제공 기업의 데이터 센터로 전송된다는 점은 우려스럽습니다. 민감한 개인정보나 파일들이 저장되고 사용되는 과정에서 정보가 유출되는 문제가 발생하기도 합니다.

 

그림 1. 구글의 GPT-2 모델이 특정 입력에 대해 사용자 개인정보를 유출하는 사례
구글의 GPT-2 모델이 특정 입력에 대해 사용자 개인정보를 유출하는 사례. 출처: KAIST

또한 이러한 문제는 최근 주목받는 대형 인공지능 모델의 경우에 더 쉽게 발생하는 경향을 띱니다. 실제 구글에서 사용하는 대화형 인공지능 모델인 GPT-2의 경우, 특정 단어들을 이야기했을 때 사용자의 개인정보 등을 유출하는 문제가 나타났습니다. 국내에서 2020년 화제가 됐던 스캐터랩의 인공지능 챗봇 '이루다'의 경우도 비슷한 케이스입니다.

 

이루다 1.0 홍보 포스터. 출처: 스캐터랩
이루다 1.0 홍보 포스터. 출처: 스캐터랩

이에 애플, 구글, 마이크로소프트 등 빅 테크 기업에서는 '차등 프라이버시(differential privacy)' 기술에 주목합니다. 차등 프라이버시 기술은 딥러닝에 사용되는 그라디언트(gradient, 학습 방향 기울기)에 잡음(노이즈)를 섞음으로써 인공지능 모델로부터 사용자의 개인정보를 유출하는 모든 종류의 공격을 방어할 수 있습니다. 하지만 이러한 장점에도 불구하고 차등 프라이버시 기술 적용 시, 기존 대비 어플리케이션의 속도와 성능이 크게 하락하는 문제가 발생했습니다. 아직까지 범용적으로 널리 적용되지 못한 이유입니다. 이는 차등 프라이버시 머신러닝 학습 과정이 일반적인 머신러닝 학습과 다르다는 측면에서, 이로 인해 기존의 하드웨어에서 효과적으로 실행되지 않아 메모리 사용량, 학습 속도 및 하드웨어 활용도(hardware utilization) 차원에서 비효율적이기 때문입니다.

 

그림 2. 유민수 교수팀이 개발한 개인정보 보호 인공지능 AI 반도체 가속기의 구조 모식도
카이스트 유민수 교수팀이 개발한 개인정보 보호 인공지능 AI 반도체 가속기의 구조 모식도. 출처: KAIST

최근 카이스트 유민수 교수 연구팀은 차등 프라이버시 기술의 성능 병목 구간을 분석해 해당 기술이 적용된 어플리케이션의 성능을 크게 시킬 수 있는 '차등 프라이버시 머신러닝을 위한 인공지능(AI) 반도체 칩'을 개발했습니다. 유민수 교수팀이 개발한 인공지능 반도체는 외적 기반 연산기와 덧셈기 트리 기반의 후처리 연산기 등으로 구성돼 있습니다. 현재 가장 널리 사용되는 인공지능 프로세서인 구글 TPUv3 대비 차등 프라이버시 인공지능 학습 과정을 3.6 배 빠르게 실행시킬 수 있죠. 엔비디아의 최신 GPU A100 대비 10배 적은 자원으로 대등한 성능을 보인다고 연구팀 관계자는 설명했습니다. 또한 이번 개발을 통해서 기존 하드웨어의 한계로 널리 쓰이지 못했던 차등 정보보호 기술의 대중화에 도움을 줄 수 있을 것으로 기대된다고 전했습니다.

또한 이번 연구는 지금까지는 없던 차등 프라이버시가 적용된 인공지능 반도체를 세계 최초로 개발했다는 점에서 의의가 있습니다. 차등 프라이버시 인공지능 기술을 대중화해 인공지능 기반 서비스 사용자들의 개인정보를 보호하는 데에 큰 도움을 줄 수 있을 것으로 보입니다. 또한, 가속기의 성능 향상은 인공지능 연구 효율을 높여 차등 프라이버시 인공지능 모델의 정확도 개선에도 기여할 것으로 주목됩니다.

 

인공지능과 머신러닝 기술의 용도. 출처: 스태티스타

프라이버시 보호 문제가 해결된다면 AI 기술은 비즈니스 분야에서 다양한 목적으로 사용될 것으로 전망됩니다. 스태티스타에 따르면 AI와 머신러닝 기술을 이용하는 주요 목적 1위는 고객 경험 개선(improving customer experience)이었습니다. 2위는 고객 인사이트 생성(generating customer insights), 3위는 고객과의 상호작용(interacting with customers)이었습니다. AI가 가리키는 방향은 결국 기업의 내부 자체 시스템 개선보다는 고객을 분석해 소비 패턴을 예측하거나 고객의 만족도를 높이기 위한 단서를 찾기 위함입니다. 결국 고객 개인 데이터가 베이스가 되는 작업들이기에 프라이버시를 확실히 보호해줄 수 있는 이번 카이스트의 연구 결과가 상당한 의미를 갖게 됩니다.

 

KAIST 전기및전자공학부 박범식, 황랑기 연구원이 공동 제1 저자로, 윤동호, 최윤혁 연구원이 공동 저자로 참여한 이번 연구는 미국 시카고에서 열리는 컴퓨터 구조 분야 최우수 국제 학술대회인 '55th IEEE/ACM International Symposium on Microarchitecture(MICRO 2022)'에서 오는 10월 발표될 예정입니다.

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 충청남도 보령시 큰오랏3길
  • 법인명 : 이웃집과학자 주식회사
  • 제호 : 이웃집과학자
  • 청소년보호책임자 : 정병진
  • 등록번호 : 보령 바 00002
  • 등록일 : 2016-02-12
  • 발행일 : 2016-02-12
  • 발행인 : 김정환
  • 편집인 : 정병진
  • 이웃집과학자 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2016-2022 이웃집과학자. All rights reserved. mail to contact@scientist.town
ND소프트