단일세포 빅데이터 분석으로 질병유전자 발굴한다
단일세포 빅데이터 분석으로 질병유전자 발굴한다
  • 이웃집과학자
  • 승인 2023.04.23 23:46
  • 조회수 1663
  • 댓글 0
이 기사를 공유합니다

연구진의 모습. 윗줄부터 남덕우 교수, 아랫줄 왼쪽부터 제 1저자 Hai Nguyen 연구원, 제 1저자 백부경 연구원. 출처 : UNIST
연구진의 모습. 윗줄부터 남덕우 교수, 아랫줄 왼쪽부터 제 1저자 Hai Nguyen 연구원, 제 1저자 백부경 연구원. 출처 : UNIST

UNIST 생명과학과 남덕우 교수팀은 단일세포 시퀀싱 데이터의 통합분석을 통해 폐암, 감염병 등의 질병과 관련된 유전자들을 효과적으로 선별해낼 수 있음을 밝혔습니다.

 

단일세포 시퀀싱(scRNA-seq)은 통상적인 벌크샘플 시퀀싱(RNA-seq)과는 달리 개별 세포수준에서 유전자 발현을 분석할 수 있는 기술인데요. 특히 각종 질병, 발생, 분화 등 생물학적 과정을 분석하는데 널리 활용되고 있습니다. 

 

벌크샘플은 상피세포와 각종 면역세포들이 섞여있어서 세포 유형의 차이를 고려하지 못하는 단점이 있죠. 반면 단일세포 시퀀싱은 세포 유형별로 순일한 유전자 발현의 변화를 측정할 수 있어 질병의 발생 기작을 보다 정확하게 분석이 가능합니다. 그러나 단일세포 데이터의 높은 잡음과 결측률, 데이터 간의 측정값의 차이(배치효과)로 인해 실제로 질병유전자의 분석에 얼마나 효과적인지 확인되지 않았었는데요.

 

연구팀은 다양한 시뮬레이션 실험과 단일세포 데이터 분석을 통해 46가지 통합분석 방법을 비교했습니다. 특히, 국내에서 생산한 1기 폐암환자들의 단일세포(상피세포) 데이터를 세포유형별로 통합분석했습니다. 이를 통해 기존에 폐암관련 유전자로 보고된 90여 개 유전자들이 통계적으로 높은 순위를 가짐을 확인할 수 있었습니다. 이는 아직 밝혀지지 않은 폐암유전자들 또한 높은 순위로 선별할 수 있음을 시사하는 결과입니다. 이러한 결과는 기존에 진행됐던 수백 명의 벌크샘플 폐암환자의 데이터 분석에서도 달성하지 못한 결과로서 단일세포 통합분석이 폐암유전자 발굴에 매우 효과적이라는 것을 보여주고 있습니다.

 

연구팀은 이번 실험의 신빙성을 높이기 위해 대규모의 COVID-19 환자 샘플에서 단핵구 세포 10만개의 데이터를 추가로 분석했습니다. 통합분석으로 유전자 발현 데이터를 분석한 결과, COVID-19 바이러스의 침입에 대응하는 것으로 알려진 130여 개의 유전자가 통계적으로 높은 순위를 차지하는 것을 재차 확인할 수 있었습니다. 연구팀은 추가 실험을 통해 서로 다른 유형의 질병에서 단일세포 데이터의 통합분석이 질병유전자를 효과적으로 선별해 줄 수 있다는 것을 확인했습니다. 

 

남덕우 생명과학과 교수는 “이번 연구 결과는 공개된 단일세포 데이터의 대규모 통합분석을 통해 새로운 질병유전자들과 작용 경로를 발굴할 수 있음을 제시해주고 있다”며 “암, COVID-19 등 다양한 질병의 기작 연구에 단일세포 데이터를 세포 수준을 넘어 유전자 수준에서 더 적극적으로 활용할 필요가 있습니다”라고 밝혔습니다.

연구결과는 국제학술지 'Nature Communications'에 2023년 3월 21일자로 게재됐습니다.

논문명: Benchmarking integration of single-cell differential expression

 

#용어설명

1. 단일세포 시퀀싱 (scRNA-seq)

단일 세포 시퀀싱은 각각의 세포 수준에서 전체 유전자의 발현을 측정하는 기술입니다. 세포 단위에서 다르게 발현되는 유전자를 식별함으로써 조직과 기관 내 세포의 다양성을 파악할 수 있으며, 세포 수준에서 질병 상태를 조사할 수 있습니다. 단일 세포 RNA 시퀸싱은 기존의 벌크 샘플 시퀸싱과 비교하여 기술적으로 복잡하고 비용이 많이 들며 잡음과 결측치가 높아 분석의 난이도가 높다는 단점이 있습니다.

2. RNA 시퀀싱 (RNA-seq)

RNA 시퀀싱은 특정한 생물학적 조건에서 유전체가 생성하는 전체 RNA 전사체(transcriptome)를 분석하는 기술로 유전자 발현에 대한 정량적인 분석을 제공합니다. 벌크 샘플 시퀸싱은 샘플 내에 포함된 모든 세포의 평균적인 유전자 발현을 측정하는 기술로 단일세포 시퀸싱과 비교했을 때 보다 단순하고 비용이 적게 들지만 샘플 내에 포함된 여러 세포유형들의 차이를 고려하지 못한다는 단점이 있습니다.

RNA 시퀸싱은 유전자 발현 분석을 통해 질병과 약물 등 다양한 생물학적 조건에서 타겟이 될 수 있는 바이오 마커를 발굴하거나, 발현하는 유전자 양상을 통해 질병을 진단하는 등 생물학 및 의학 분야에서 폭넓게 사용되고 있습니다.

3. 배치효과 (batch effects)

배치효과란 시퀸싱 데이터 내의 여러 샘플 그룹(배치) 사이에 나타나는 기술적인 차이를 말합니다. 이러한 차이는 시퀀싱 기기, 실험 프로토콜, RNA 추출 방법, 온도 또는 습도와 같은 실험실 환경의 차이를 포함한 다양한 요인으로 인해 발생할 수 있습니다. 배치효과가 존재하는 RNA 시퀸싱 데이터를 분석할 경우 유전자가 세포 및 샘플 간 다르게 발현하는 양상이 배치효과에 영향을 받을 수 있어 잘못된 결과가 도출될 수 있습니다.

데이터의 기술적 변이를 줄이고 분석의 신뢰성을 높일 수 있도록 배치 효과를 해결할 수 있는 배치정규화 기법이나 배치 보정 방법 등 다양한 방법이 개발되고 있습니다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

  • 충청남도 보령시 큰오랏3길
  • 법인명 : 이웃집과학자 주식회사
  • 제호 : 이웃집과학자
  • 청소년보호책임자 : 정병진
  • 등록번호 : 보령 바 00002
  • 등록일 : 2016-02-12
  • 발행일 : 2016-02-12
  • 발행인 : 김정환
  • 편집인 : 정병진
  • 이웃집과학자 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2016-2024 이웃집과학자. All rights reserved. mail to contact@scientist.town
ND소프트