암세포 정확한 분석, '하마'가 답?

연세대학교 의과대학 김상우 교수연구팀이 환자의 암세포 시료를 분석할 때 외부요인을 줄여 분석의 정확도를 높이는 방법을 개발했다고 밝혔습니다. 해당 연구 논문은 <Genome Biology>에 게재됐습니다.

정확도를 위해 하마를 찾아라

환자의 치료 과정에서 유전자 검사나 약물 반응 검사 등을 위해 종양 조직을 여러 차례 분석하는 일이 불가피합니다. 때문에 한 번 채취한 종양 세포를 자연적으로 보존하고 충분히 증식시켜 여러 검사의 시료로 쓸 수 있도록 하는 환자유래모델(PDMS, patient-derived models)이 활용되죠.

다만 종양세포는 주로 생쥐(mouse)의 체내에서 증식시키거나 생쥐의 세포와 함께 배양합니다. 때문에 쥐의 세포가 함께 분석돼 자칫 잘못된 결과가 나올 수 있다는 문제점이 있습니다. 이러한 가능성은 꾸준히 제기돼왔습니다. 하지만 발생빈도나 예방방법에 대해서는 알려진 바 없었습니다.

연구진은 환자유래모델에서 있을 수 있는 돌연변이 분석 오류를 찾아내는 방법을 개발했습니다. 이 방법은 나아가 미연에 오류를 방지할 수 있다고 하는데요. 연구팀은 우선 쥐와 사람에게서 나타나는 모든 유전자 서열 차이를 찾고 이를 '하마(HAMA, human-genome aligned mouse allele)'라고 명명했습니다. 분석 과정에서 이러한 '하마'가 나타난다면 질병 관련 유전 변이로 오인할 수 있는데요. 연구팀은 생쥐의 유전체 정보로 인한 오류 가능성을 한 번 더 확인하도록 안전 장치를 제안했습니다.

연구팀은 특히 암 관련 돌연변이 데이터베이스의 정보 중 생쥐를 이용한 실험모델에서 비롯된 경우 유독 '하마'의 관찰빈도가 높게 나타남을 확인했습니다. 나아가 연구진은 유전체 검사 데이터를 통해 나오는 '하마'의 비율을 토대로 환자유래모델에 섞여 있는 쥐 세포의 비율까지 계산할 수 있는 방법을 제시했습니다. 연구팀은 또한 150가지가 넘는 가상의 오염 데이터를 기반으로 비교 분석을 수행해 최적의 오염 배제 방법을 밝혀냈습니다.

연구팀은 생산한 쥐의 유전체 서열 데이터를 인간 유전체 서열 데이터와 다양한 비율로 혼합했습니다. 그 다음 모든 하마 위치의 변이 서열 발생빈도를 계산했죠. 그 후 연구팀은 미지의 시료에 포함된 쥐 유전체의 오염도를 예측할 수 있는 공식을 도출했습니다. 연구팀은 현재까지 개발되고 알려진 인간과 쥐의 유전체를 분리하는 프로그램과 방법들의 성능을 비교 분석했습니다. 가장 효과적인 쥐 유전체 제거 방법을 제시하기 위해서였죠. 이를 토대로 연구팀은 분석 목적별로 가장 높은 성능을 가진 프로그램을 제시했습니다.

하지만 이와 같은 프로그램을 통해 쥐의 유전 서열을 분리 및 제거하는 과정을 거치더라도 쥐 유전체에서 유래한 유전 변이가 여전히 소량 검출됐습니다. 이때 연구팀은 밝혀낸 하마 리스트와 일치하는 유전 변이를 추가로 제거햐야만 정확도 향상을 이루어 낼 수 있음을 확인했습니다. 위의 연구 결과를 토대로 환자 유래 모델에서 검출되는 쥐 유전 서열들을 제거하기 위한 최적 분석법을 제시했습니다. 연구팀은 실제 이를 토대로 최적 유전자분석법을 적용했는데요. 적용 결과 기존 분석 대비 정확성을 약 58%가량 높일 수 있었다고 합니다.

김상우 교수는 "본 연구는 체외에서 보존, 증식된 환자 암세포 시료(Specimen)의 유전체 분석 과정에서 발생할 수 있는 오류를 바로잡아 향후 더욱 정확한 정보에 기초해 환자를 치료할 수 있는 실마리가 될 것"이라고 밝혔습니다.

##참고자료##

SW Kim ; Impact of mouse contamination in genomic profiling of patient-derived models and best practice for robust analysis. Genome Biology(2019).

강지희 다른기사 보기