독일 연구팀, 승인 연구 바탕으로 효과와 근거의 신뢰성 분석…결과 측정·데이터 부족 편향 위험 높아
사진: 게티이미지뱅
[메디게이트뉴스 박도영 기자] 독일은 2019년 디지털 헬스케어 법(Digital Healthcare Act)을 제정하면서, 세계 최초로 디지털 헬스 애플리케이션(DiGAs) 을 국가 건강 보험 시스템에 통합한 국가가 됐다. 이에 2020년부터 규제당국으로부터 의료기기로 승인을 받은 디지털 헬스 앱 처방 시 발생하는 비용은 전액 건강 보험에서 보장해준다. 그러나 실제승인 연구를 검토한 결과 앱의 효과를 뒷받침하는 근거를 신뢰하기 어렵다는 우려가 제기됐다.
독일 드레스덴공과대학 칼 구스타프 카루스 대학병원(University Hospital Carl Gustav Carus) 연구팀이 최근 네이처 리서치의 의학저널 npj Digital Medicine에 '독일에서 보험 적용 가능한 디지털 헬스 애플리케이션의 헬스케어 효과 및 근거의 신뢰성: 체계적 문헌 고찰' 논문을 발표했다.
디지털 헬스 앱은 질병, 부상, 장애의 인식, 모니터링, 치료, 완화 등을 지원하는 환자 치료를 목적으로 설계된 앱을 말한다. 완전 승인을 받기 위해서는 의료적 혜택(건강 상태 개선, 삶의 질 개선, 질병 지속 기간 단축, 생존 기간 연장) 또는 환자 관련 구조 및 프로세스 개선(환자의 건강 행동 지원, 환자와 의료 제공자 간 프로세스 통합)에 대한 긍정적인 의료 효과를 입증해야 한다.
연구팀은 앱과 관련된 연구 특성과 측정 도구, 결과, 긍정적인 의료 효과를 살피는 한편 완전 승인을 위해 제출된 연구의 연구 편향 위험을 평가하고자 체계적 문헌고찰을 실시했다.
디지털 헬스 앱 연구 23건분석 결과, 연구 편향 위험 높아
연구팀은 2024년 3월 기준 규제 기관에 제출된 디지털 헬스 앱 21개에 대한 승인 연구 23건을 분석했다. 그 결과 표본 크기(56명에서 1245명까지)와 탈락률(개입 그룹 평균 21.7%, 대조군 11.8%), 개입 기간(1.5개월에서 12개월까지) 등 연구 간 설계 및 연구 특성에 차이가 큰 것으로 나타났다. 모든 연구에서 주요 결과에 대해 통계적으로 유의미하고 주로 중간~큰 그룹 간 효과를 보고했다. 반면 부차적 결과에 대한 결과는 변이가 컸다.
사진: 5개 편향 영역별 및 전체적인 연구 편향 위험 평가 등급(저위험, 일부 우려, 고위험)의 백분율 분포(자료=npj Digit. Med. 8, 495 (2025))
또한 모든 승인 연구에서 전체 연구 편향 위험(RoB)이 높은 것이 확인됐다. 이는 특히 결과 측정(23건 중 21)과 데이터 부족(23건 중 15건)에서 두드러졌다.
무작위 배정 과정에서 발행하는 편향 관련 10개 연구에서 RoB가 낮은 것으로 평가됐으나 11개 연구에서 일부 우려가 확인됐고, 한 연구는 높은 RoB를 가진 것으로 평가됐다. 예를 들어 무작위 배정을 명확하게 보고하지 않았거나 배정 은폐 방법을 적절하게 설명하지 않았거나 배정을 적절하게 은폐하지 못하는 등 문제가 있었다.
의도된 개입으로부터의 편차로 인한 편향 관련 2개 연구에서 RoB가 낮았으나, 19건 연구에서 일부 우려가 제기됐고, 3개 연구는 RoB가 높게 평가됐다. 높은 RoB는 주로 참가자가 개입을 인지했거나, 중요한 비프로토콜 개입의 영향과 이러한 요인의 연구 그룹 간 균형에 대한 보고가 불충분했기 때문인 것으로 분석됐다.
데이터 결손으로 인한 편향 측면에서 8개 연구는 RoB가 낮게, 나머지 14개 연구는 높게 평가됐다. 높은 RoB는 주로 탈락률이 5%를 초과했고, 결손된 결과 데이터로 인한 편향이 없음을 입증하는 분석이 부족한 데서 기인했다.
결과 측정 편향 측면에서는 21개 연구에서 RoB가 높은 것으로 확인됐다. 이는 주로 환자 보고 결과 측정 때문으로, 결과물이 받은 개입에 대한 인식에 의해 영향을 받았을 수 있음을 의미한다.
높은 탈락률, 실제 처방 후 활용 측면에서 도전과제 시사…결과 측정 도구 사용 차이 커
연구팀은 논문에서 "승인 연구에서 검토된 결과의 범위가 넓고, 앱이 신기술성과 국제적 유일성을 가진다는 점에서 승인 연구에서 보고된 효과와 이전 연구 결과를 비교하는 논의 불가능하다. 다른 모바일 건강 앱에서 발견된 효과와의 비교 가능성도 낮다"면서 "디지털 헬스 앱 승인 연구는 비교하기 어렵고 긍정적 건강관리 효과에 대한 근거는 결과에 편향이 생기기 쉽기 때문에 비판적으로 평가해야 한다"고 결론내렸다.
또한 "여러 승인 연구에서 개입 그룹의 탈락률이 대조군보다 높았다. 이 현상의 원인과 의미를 평가하는 것은 더 어렵고 명확한 결론을 내리기 어렵다"면서 "임상시험을 넘어 개입 그룹의 높은 이탈률은 실제 의료 환경에서 앱을 사용하는 데 있어 특히 처방 후 준수 및 활용 측면에서 도전 과제를 시사한다. 궁극적으로 낮은 활용도는 디지털 헬스 앱의 전반적인 효과에 부정적인 영향을 미칠 수 있다"고 지적했다.
연구팀은 "승인 연구에서 보고된 결과와 결과 측정 도구에도 차이가 컸는데, 이는 단순히 대상 적응증의 다양성 때문이 아니라, 동일한 적응증에 대해조차 승인 연구가 서로 다른 결과와 측정 도구를 사용했기 때문이다"면서 "결과와 측정 도구의 다양성은 승인 연구와 보고된 긍정적 의료 효과를 비교하는 것을 어렵게 만든다. 비교 가능성을 높이기 위한 방법 중 하나는 승인 연구에서 핵심 결과 세트의 사용을 의무화하는 것이다"고 말했다.
마지막으로 "연구 결과 특히 RoB 평가 결과는 디지털 헬스 앱의 긍정적 의료 효과에 대한 승인 연구에서 제시된 근거를 신중하게 고려해야 함을 명확하게 보여준다"면서 "디지털 헬스 앱 승인 절차를 개선해 연구 품질을 높여야 한다"고 주문했다.
연구 품질을 높이는 방안으로는 ▲완전 승인 기준을 조정하는 것 ▲리얼월드 근거를 승인 과정의 필수 구성 요소로 포함하는 것 ▲규제기관의 승인 과정 투명성을 강화하는 것 등을 제안했다.
댓글보기(0)