“살려주세요” 산속 조난 위치 소리로 찾는다
“살려주세요” 산속 조난 위치 소리로 찾는다
  • 이웃집과학자
  • 승인 2021.06.21 23:42
  • 조회수 3864
  • 댓글 0
이 기사를 공유합니다

국내 연구진*이 소리가 나는 곳의 위치와 크기를 정확하게 시각화할 수 있는 인공지능 기술을 개발했습니다. 이번 기술은 기존보다 10배 이상 정확하며, 연산시간은 10분의 1 수준이라고 합니다.

* 한국표준과학연구원(KRISS, 원장 박현민) 음향진동초음파표준그룹 장지호 책임연구원, 포항공과대학교(포스텍, 총장 김무환) 기계공학과 이승철 교수, 이수영 박사과정 학생 (이하 KRISS-포스텍 공동연구팀)

KRISS-포스텍 공동연구팀이 연구실 내부에서 실험을 진행하고 있다.[포스텍 이승철 교수(좌), 포스텍 이수영 학생(가운데), KRISS 장지호 책임연구원(우)]
KRISS-포스텍 공동연구팀이 연구실 내부에서 실험을 진행하고 있다.[포스텍 이승철 교수(좌), 포스텍 이수영 학생(가운데), KRISS 장지호 책임연구원(우)]

KRISS-포스텍 공동연구팀은 소리의 위치와 크기를 이미지로 변환하는 인공지능 기술을 개발하고 지도처럼 시각화해 쉽게 위치를 파악할 수 있도록 했는데요. 이를 실생활에 활용하면 ‘산속 조난자 위치’를 소리로 찾을 수도 있다고 합니다. 최근 드론과 같은 무인 항공기 기술은 사람의 개입 없이 정찰·수송·구조 등의 분야에 전천후로 활용되고 있지만, 무인 항공기 기술을 통한 음원 위치 추적기술은 정밀도가 낮고 주변 소음 환경에 따라 극심한 성능 저하가 불가피하다는 단점이 있습니다. 공동연구팀이 개발한 음원 위치 추적기술은 기존보다 10배 이상 정확한 정보를 제공하기 때문에 드론 프로펠러 소음이나 다른 배경 소음이 있는 악조건에도 사용할 수 있습니다. 향후 정찰·수송·구조 등에 이번 기술을 결합하면 다양한 비대면 드론 임무 성공에 기여할 것으로 기대하고 있습니다.

KRISS-포스텍 공동연구팀의 딥러닝 기반 음원 위치 추적기술. 공동연구팀이 개발한 ‘딥러닝 기반 음원 위치 추적기술’의 드론 조난자 구조 활용 시나리오. 산속 조난자의 소리를 탐지해 시각화하는 기술을 나타내며, 해당 시각화된 음원 지도는 각 소리의 위치와 크기 정보를 담고 있다. 공동연구팀이 제안한 기술은 근접한 음원도 각각 따로 구분해서 보여줄 수 있으며(고분해능) 소리의 위치·크기 예측 성능(고정밀) 또한 기존 대비 획기적으로 향상되었다.
KRISS-포스텍 공동연구팀의 딥러닝 기반 음원 위치 추적기술. 공동연구팀이 개발한 ‘딥러닝 기반 음원 위치 추적기술’의 드론 조난자 구조 활용 시나리오. 산속 조난자의 소리를 탐지해 시각화하는 기술을 나타내며, 해당 시각화된 음원 지도는 각 소리의 위치와 크기 정보를 담고 있다. 공동연구팀이 제안한 기술은 근접한 음원도 각각 따로 구분해서 보여줄 수 있으며(고분해능) 소리의 위치·크기 예측 성능(고정밀) 또한 기존 대비 획기적으로 향상되었다.

들리는 소리의 위치를 정확하게 파악하는 이번 기술은 전기 누전·가스 누출 및 누수의 위치를 소리로 탐지할 수 있는 등 국민의 안전을 위한 분야에도 적극 활용이 가능할 것으로 전망되는데요. 아울러, 층간 소음의 위치를 정확히 파악하는 등 국민의 편의를 위한 분야에도 활용이 가능할 것으로 판단됩니다.

소리에는 많은 정보가 담겨 있습니다. 그러나 기존에는 충분한 분해능과 정확도가 확보되지 않아 소리에 포함된 다양한 정보를 충분히 활용할 수 없었습니다. 소리의 위치를 찾아도 크기까지 예측하기는 어려웠고, 여러 소리가 섞여 있는 경우 위치의 정확도가 현저히 낮기 때문이죠. 정확도를 높이면 많은 시간이 소요된다는 단점도 있었습니다.

기존 기술에 의한 음원 지도(상), KRISS-포스텍 공동연구팀이 제안한 방법의 음원 지도 (하). 적색으로 갈수록 소리의 크기가 크고 청색으로 갈수록 소리가 작다. 기존 기술에 의한 음원 지도(상)는 적색 영역이 넓어서 음원의 위치를 특정하기 어렵고, 다수의 음원이 있을 때 영역들이 서로 합쳐져서 하나인 것처럼 나타난다. 또한, 높은 주파수에서는 음원이 없는 위치에서 적색 영역이 나타난다. 공동연구팀이 제안한 음원 지도(하)는 근접한 음원도 각각 따로 구분해서 보여줄 수 있으며 높은 주파수에서 음원이 있는 위치에만 적색 영역이 만들어진다.
기존 기술에 의한 음원 지도(상), KRISS-포스텍 공동연구팀이 제안한 방법의 음원 지도 (하). 적색으로 갈수록 소리의 크기가 크고 청색으로 갈수록 소리가 작다. 기존 기술에 의한 음원 지도(상)는 적색 영역이 넓어서 음원의 위치를 특정하기 어렵고, 다수의 음원이 있을 때 영역들이 서로 합쳐져서 하나인 것처럼 나타난다. 또한, 높은 주파수에서는 음원이 없는 위치에서 적색 영역이 나타난다. 공동연구팀이 제안한 음원 지도(하)는 근접한 음원도 각각 따로 구분해서 보여줄 수 있으며 높은 주파수에서 음원이 있는 위치에만 적색 영역이 만들어진다.

KRISS-포스텍 공동연구팀은 시간을 단축하면서 정확도를 높일 수 있는 딥러닝 알고리즘을 개발했다. 여러 소리가 섞여 있는 악조건에서도 개별 음원의 위치와 크기를 정밀하게 구분할 수 있습니다.

 

공동연구팀은 다양한 음향데이터를 구현하기 위해 56개 스피커를 구 형태로 실험실에 설치했습니다. 이 가운데 여러 개의 스피커에서 특정 소리를 내면 개발한 알고리즘으로 위치와 크기를 추적해 이를 지도처럼 시각화하는데요. 기존 방법보다 10배 이상 정확하며, 연산시간을 10분의 1로 크게 단축했습니다.

KRISS-포스텍 공동연구팀이 시각화한 목표지도 예시(좌), KRISS-포스텍 공동연구팀이 개발한 딥러닝 알고리즘 구조(우). 공동연구팀은 음원의 위치와 소리 크기를 그림과 같이 이미지화한 것을 목표지도(그림, 좌)라고 명명했다. 공동연구팀이 개발한 목표지도 데이터 표현법(Data representation)은 음원의 위치 및 크기에 대해 격자 제한이 없는 표현이 가능하다. 목표지도를 바탕으로 이를 정확하게 예측하기 위한 최적의 딥러닝 알고리즘(그림, 우)을 개발하였다. 목표지도 개념 도입과 딥러닝 알고리즘 최적화를 통해, 기존 기술의 성능을 획기적으로 향상할 수 있었다.
KRISS-포스텍 공동연구팀이 시각화한 목표지도 예시(좌), KRISS-포스텍 공동연구팀이 개발한 딥러닝 알고리즘 구조(우). 공동연구팀은 음원의 위치와 소리 크기를 그림과 같이 이미지화한 것을 목표지도(그림, 좌)라고 명명했다. 공동연구팀이 개발한 목표지도 데이터 표현법(Data representation)은 음원의 위치 및 크기에 대해 격자 제한이 없는 표현이 가능하다. 목표지도를 바탕으로 이를 정확하게 예측하기 위한 최적의 딥러닝 알고리즘(그림, 우)을 개발하였다. 목표지도 개념 도입과 딥러닝 알고리즘 최적화를 통해, 기존 기술의 성능을 획기적으로 향상할 수 있었다.

KRISS 장지호 책임연구원은 “음향과 인공지능 분야에서 각각 전문성을 가진 KRISS와 포스텍이 다학제적 융합연구를 진행한 것이 좋은 성과로 연결됐다”라며, “기술이 상용화되어 기존 시장에 혁신을 가져올 수 있도록 지속적인 연구를 수행할 계획”이라고 포부를 밝혔습니다. 이번 연구성과는 기계공학 분야의 세계적인 학술지인 메카니컬 시스템 앤 시그널 프로세싱(Mechanical Systems and Signal Processing, IF: 6.471, JCR Top 3.4%)에 지난 5월 게재됐습니다.

 

관련 논문

제목: “Deep learning-based method for multiple sound source localization with high resolution and accuracy”, Mechanical Systems and Signal Processing (IF: 6.471), 161 (2021) 107959 

 

연구 과정 상세 설명

제안한 방법의 성능을 검증하기 위해 특정 조건을 상정하여 시뮬레이션 및 실험을 수행했다. 

(1) 다수의 마이크로폰으로 이루어진 마이크로폰 어레이가 음원으로부터 발생하는 소리의 음압 신호를 측정하는 상황을 가정했다. 

(2) 시뮬레이션으로 음압 신호들을 계산하여 인공지능 학습을 위한 데이터를 생성했다.

(3) 시뮬레이션으로 생성된 시험 데이터를 생성하여 성능을 산출하였고, 이를 기존 방법을 사용한 결과와 비교했다. 

(4) 56개 스피커가 설치된 실험실에서 스피커가 생성한 소리를 마이크로폰으로 측정했고, 학습된 인공지능 신경망으로 측정된 신호를 처리하여 음원 위치 및 레벨을 예측했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 충청남도 보령시 큰오랏3길
  • 법인명 : 이웃집과학자 주식회사
  • 제호 : 이웃집과학자
  • 청소년보호책임자 : 정병진
  • 등록번호 : 보령 바 00002
  • 등록일 : 2016-02-12
  • 발행일 : 2016-02-12
  • 발행인 : 김정환
  • 편집인 : 정병진
  • 이웃집과학자 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2016-2024 이웃집과학자. All rights reserved. mail to contact@scientist.town
ND소프트