디지털 헬스케어 시리즈는 5부작으로, 헬스케어 시장에서 AI가 일으키는 변화를 분석합니다. 이번 편에서는 “질병 예측” 세그먼트를 살펴봅니다.
[편집자주]

지난 편에서는 헬스케어 시장 전반에 AI가 필요한 이유에 대해 정리해보았습니다. 고급 의료 인력이 노동 집약적으로 투입되는 의료 서비스는 원가가 비싸기 때문에 만성적으로 부족한 상황이며, AI는 의료 원가를 낮춰 공급을 확대하는 방안이 될 수 있다는 것이 큰 맥락이었습니다. 

이번 편에서는 질병 예측에서 AI가 어떻게 활용될 수 있는지 살펴봅니다. 여기서 AI의 역할은, 사람들이 자신의 건강 관련 정보를 입력했을 때 다양한 질병에 대한 가능성을 알려주는 것입니다. 핵심은 최대한 다양한 질병의 예후 데이터를 확보하고, 고객들의 건강 데이터를 많이 수집하는 것입니다. 

질병 예측에 보편적으로 사용되는 데이터들을 살펴봅시다.

정기 건강검진 등 각종 의료기관 검진 데이터

질병에 관한 연관성이 가장 높은 데이터라고 볼 수 있습니다. 신체 내외부의 데이터를 총망라하지만, 획득 방법(내원)과 비용(검진비용)이 비싸서 측정 빈도가 낮습니다. 그리고 병원과 검진 기관에 데이터가 갇혀있기 때문에 활용도도 떨어집니다. 

최근에는 의료 마이데이터 사업으로 병원에 잠자고 있던 데이터를 활용할 길이 제도적으로는 열렸으나, 2020년 6월 기준 서울대학교병원, 메디블록, 평화이즈 등 극히 제한된 수의 사업자만을 선정되었으며, 사실 우리가 체감하는 변화는 없습니다. (평화이즈라는 업체는 가톨릭병원 계열의 SI 업체입니다) 

[그림1] 금융 마이데이터 서비스 예시 ./ 헤럴드경제

마이데이터 사업이란, 한 도메인에서 데이터를 다량으로 보유한 소수의 기관들이 데이터를 표준화해 허가된 사업자들과 공유하기로 한 보따리에 넣도록 하고, 허가된 사업자들이 소수의 기관들에 일정 수수료를 지불하고 보따리 속의 데이터를 활용할 수 있게 하는 것입니다. 원래 데이터를 보유한 기관들이 데이터라는 자원을 거의 활용하지 못했기 때문에 소비자 권익이 충분히 증진되지 못한다고 판단하여, 제3의 사업자에게 제도적으로 기회를 부여하는 것이지요.

하지만 현실적으로 의료기관들의 의료 데이터를 제3의 기업이 활용하는 것은 거의 불가능에 가깝습니다. 의료 데이터는 개별 의료기관들이 태초부터 독점해왔고, 이 데이터가 얼마나 가치 있는지 잘 알고 있기 때문에 데이터 제공에 상당한 대가를 요구하기 때문입니다. 또한, 각 의료기관이 사용하는 기기가 다르고, 축적된 데이터를 라벨링 하는 방식도 제각각이기 때문에 의료기관끼리 데이터를 공유하는 것조차도 어렵습니다. 

[그림2] 서울대학교병원 ‘마이헬스데이터’ 앱 사용 화면 ./ 플레이스토어

이러한 이유로, 병원들은 개별 컨소시엄을 구성해 서비스를 출시하고 싶어합니다. 예시로, 서울대학교병원에서 출시한 ‘마이헬스데이터’라는 퍼스널 헬스 기록 앱은 현재로서는 서울대학교병원 혹은 차움병원에서의 진료 기록이 없으면 기능이 매우 제한적입니다. 

향후 협력 의료기관을 추가해나가겠다고 했지만, 그 과정이 얼마나 순탄할지, 그리고 얼마나 고객 중심적인 서비스가 탄생할지도 미지수입니다. 해외에서도 병원들이 출시한 유사 서비스는 찾아볼 수 있지만, 실질적으로 사람들이 가장 많이 사용하는 앱은 원격진료 앱이나 다양한 센서로 건강 상태를 측정해주는 애플/삼성 헬스 등이기 때문입니다.

개별 의료기관이 한 사람 혹은 질병에 대해 제공할 수 있는 데이터의 양은 제한적이기 때문에 여러 기관의 데이터를 한 데 묶어서 모델을 학습시켜야 하는데, 데이터를 수지타산에 맞는 수준에 제공하느니 자체 사업에 눈독을 들이고 있는 상황이라, 현재로서는 결국 공공 데이터 활용 확대 정도가 이뤄지고 있습니다. 

물론 공공 데이터만을 활용해서도 효용이 있는 서비스들이 출시된 바 있습니다. 흔히 쓰이는 예로, 뱅크샐러드의 보험 추천 기능은 심평원(건강보험심사평가원)의 건강검진 데이터를 활용합니다. 해당 서비스는 의료(건강검진) 도메인과 금융(보험) 도메인의 빅데이터를 합쳤기 때문에 가능했습니다. 

AI로 질병을 예측하려면…

AI로 유의미한 질병 예측이 이뤄지려면, 절대적인 데이터양이 아주 많아야 합니다. 꽤 정교한 모델을 만들고 싶다면 최소한 수십만 개의 데이터 포인트가 필요합니다. 데이터의 양을 늘리려면 두 가지가 모두 충족되어야 하는데요,

1. 여러 사람으로부터 한 종류의 데이터를 모으기: 심평원이 보유한 누적 건강검진 데이터가 약 6조 건이라고 합니다. 전 국민을 대상으로 수년간 정부 차원에서 일괄적으로 모은 데이터가 이 정도라는 뜻입니다. 충분한 양의 데이터를 확보하는 것은 한국이라는 작은 시장에서는 생각보다 더 어려운 일입니다.

2. 한 사람의 데이터를 오랜 기간에 거쳐 축적하기(시계열): 만성질환을 앓는 환자가 아닌 평범한 사람들이 병원을 찾는 빈도를 생각해보면, 사실 많은 데이터가 쌓일 수가 없습니다. 정기적으로 방문할 일은 겨우 건강검진 정도이고, 이마저도 1년에 한 번꼴이니까요.

의료기관의 정보를 활용하는 것은 이권 다툼 때문에 매우 어렵고, 실제 데이터양도 많지 않은 데다 가격도 비쌉니다. 즉, 예측 단계에서 해당 정보로 큰 가치를 창출하기 어렵습니다. 

진단은 어떤 질병을 앓고 있을 가능성이 매우 높을 때 받게 되어, 페인 포인트가 강력합니다. 이로 인해 내원이라는 번거로움과 검진이라는 비용을 모두 지불합니다. 예측은 당장은 질병을 앓고 있지 않지만, 미래에 질병을 앓을 가능성을 예측하는 것이기에 상대적으로 페인 포인트가 약합니다. 

질병 예측의 효용을 고려해보면, 저렴한 비용으로 한 번에 훨씬 더 많은 양의 데이터를 획득할 수 있거나(유전자 데이터), 혹은 낮은 난이도로 빈번하게 데이터를 획득할 수 있다면(실생활 데이터) 예측 모델 구성에 훨씬 용이할 것입니다.

유전자 데이터

[그림3] DNA의 구조: A, T, C, G로 코딩되어있다 ./ ASHG

유전자 데이터는 우리 DNA에 담긴 정보를 의미합니다. DNA는 위의 그림에서 보듯이, 4가지 염기(A, T, C, G)들이 쌍을 이뤄 인산염에 중첩되어 이중나선의 모양으로 꼬여있는데요, 한 가닥의 DNA는 총 30억  쌍의 염기 서열로 이뤄져 있습니다. 이 염기 서열들은 생성되어야 하는 단백질들에 대한 정보를 담고 있습니다. A, T, C, G로 ‘코딩’된 생명 빅데이터인 셈입니다.

유전자 데이터의 시초는 2006년에 등장한 23andMe라는 스타트업입니다. 구글 공동창업자 중 한 명인 세르게이 브린의 아내였던 앤 위짓스키(Anne Wojcicki)가 창업한 회사입니다. 

[그림4] 23andme의 키트 구성품 ./ 23andMe

이 회사의 비즈니스의 핵심은 DTC(direct-to-customer)입니다. 병의원을 거치지 않고 소비자에게 23andme가 직접 서비스를 제공하는 것이죠. 유전체 분석을 희망하는 소비자는 23andme의 키트를 온라인으로 구매하고, 분석 서비스를 선택합니다. 조상(ancestry) 분석은 $99(약 11만 원), 조상+건강(50여 가지 질병 가능성) 분석은 $199(약 22만 원)입니다. 침을 뱉어 키트에 묻힌 뒤, 밀봉해서 23andme로 보내면, 약 3~4주 뒤에 온라인으로 분석 결과를 확인할 수 있습니다.

[그림5] 23andme의 조상 분석 예시 ./ Red Thread Broken

유전자데이터를 활용해 이 모든 것을 분석한다니, 아주 정확할 것만 같습니다. 하지만 이 서비스의 가장 큰 문제는 낮은 정확도입니다. 일례로, 두 일란성 쌍둥이가 각각 키트를 보냈더니, 서로 조상 결과가 다르다고 나오는 해프닝이 있었습니다. 또한, 한 사람이 시간차를 두고 키트를 두 번 보냈더니 조상 결과가 다르다고 나온 적도 있었다고 합니다. 

23andme는 정답이 아니라 자사에 제출된 유전자 빅데이터 기반의 가장 합리적인 추론 결과를 알려줍니다. 질병 예측 가능성에 대해서도 신뢰도가 의심되는 것은 어쩔 수 없습니다. 이로 인해 미국에서는 개별 질병 예측에 대해 일일이 FDA 허가를 받도록 한 상황입니다. 또한, 유전체만 가지고 질병 예측을 하는 것은 아주 위험한 일입니다. 생활 방식과 환경이 끊임없이 변화하기 때문에  유전체가 우리 건강의 전부를 대변하지는 못하기 때문입니다.

또한, 23andme는 소비자들로부터 획득한 유전체 정보를 다수의 제약사에 판매하고 있습니다. 약 11만 원을 내고 정확도를 신뢰하기 어려운 분석 리포트를 받으면서, 정작 나의 유전체 정보는 제약사에 팔리고 있는 것이죠. 물론 빅데이터가 증가하면서 분석의 신뢰도는 높아지겠지만, 정량적으로는 신뢰도를 측정하기 어려울 것입니다.

결국 의료 목적의 활용도보다는, 나의 조상과 유전자에 대한 호기심을 마케팅으로 풀어내 지금까지 온 것은 아닐까 싶습니다. 질병 예측 서비스를 제공하는 업체는 23andme 한 곳이지만, 조상 분석 관련 서비스를 제공하는 업체들은 여러 곳이 있습니다. 2019년 기준 유전체 정보 글로벌 시장 규모는 이미 9억 3000만 달러(1조 1,080억 원)에 달했으며, 2024년엔 19억 9000만 달러(2조 3,710억 원)로 성장할 전망이라고 합니다. 

한국에도 진단 키트 업체들 중 비슷한 사업을 영위하는 업체들이 있습니다. 기본적으로 의료기관 혹은 의사 처방을 통한 유전체 분석을 주요 비즈니스 모델로 삼고 있고, 정부 허가 카테고리에 대해서만 DTC 판매가 가능합니다. 다만, 일반 건강검진을 통해 충분히 할 수 있는 정보들이기 때문에 널리 활용되지는 않고 있습니다.

실생활 데이터

스마트워치는 가장 널리 쓰이는 헬스케어 디바이스입니다. 최근 스마트워치에는 심전도 센서, 혈중 산소 포화도 센서가 일반적으로 탑재되며, 혈압 센서까지 탑재될 예정입니다. 

최근 구글은 핏빗(Fitbit)의 인수를 마무리했습니다. 핏빗은 최초로 스마트 워치라는 개념을 고안해낸 스타트업이지만, 최근 성과는 부진했습니다. 고성능 센서들을 탑재해 애플 워치를 비롯한 헬스케어 시장을 공략하려는 업체들과 샤오미 등 저렴한 원가를 바탕으로 물량공세를 해온 중국 업체들, Fossil 등 패션 액세서리로 워치를 접근한 업체들 사이에서 고전을 면치 못하고 있었습니다. 

[그림6] 스마트워치 시장점유율 추이 ./ counterpointresearch

최근 시장에서 핏빗은 점유율 5% 미만으로 내려앉았습니다. 구글은 고전을 면치 못하는 핏빗을 무려 21억 달러(약 2.3조 원)에 인수했는데요. 약 2,900만 명의 MAU(월간활성이용자수)에서 발생하는 데이터를 목적으로 한 것으로 보입니다.

[그림7] 스마트벨트 Welt ./ Welt

스마트워치 외에도 스마트벨트 등 웨어러블의 형태로 우리 몸에 상시 부착되어 정보를 수집하는 기기들을 개발하려는 시도는 계속되고 있으나, 오랜 기간동안 시계만큼 피부에 익숙하게 밀착되어 온 기기는 드뭅니다. 이러한 까닭에 애플, 삼성, 구글, 화웨이, 샤오미 등 빅테크들은 스마트워치에 더욱 공을 들이고 있습니다.

이러한 데이터를 수집하면, 단기적으로 자체 건강 관리 앱을 통해 보험, 건강기능식품, 헬스 관련 용품 등 직접 수익화가 가능하며, 더 먼 미래를 내다보자면, 원격 진료에서도 활용될 수 있습니다. 

가장 완벽한 예측 모델

의료 데이터와 실생활의 건강 데이터(걸음 수, 맥박, 혈압 등) 그리고 유전자데이터까지 모두 결합한다면 가장 정교한 질병 예측 모델을 구상해볼 수 있을 것입니다. 하지만, 애석하게도 이 모든 데이터들에 대한 주권은 100% 개개인에게 있지 못합니다. 플랫폼이 정보를 분석해주는 대가로 우리는 정보를 제공하기 때문입니다.

임상 관련 데이터는 의료기관이 보유하고 있지만, 실시간 건강 데이터는 빅테크 기업들이 확보하고 있습니다. 초협력을 통해 대단한 예측 알고리즘을 만들어낼 수도 있겠지만, 이해관계의 상충으로 인해 가능성은 낮아보입니다.

다음 글에서는 예측-예방-진단-치료 중 “예방”을 다룹니다. 이번 편에서는 데이터 수집에 대한 이야기가 주를 이뤘는데요, 다음 글에서는 데이터를 활용한 구체적인 서비스들을 여러 가지 살펴보려고 합니다. 특히 고령층을 대상으로 하는 다양한 모니터링 기기와, 맞춤 운동/식단 서비스들을 주로 다룰 예정입니다.

페이스북 페이지

새 글을 텔레그램으로 받아보세요.

About the Author

캐서린

Author

국내 모 벤처캐피탈에서 심사역으로 근무하고 있어요. 궁금한 게 많지만 게으른 사람이라, 글을 쓰면서 부지런해지려고 노력 중이에요.

View All Articles