Residuals & Deicision Curve Analysis


Information

일자 2026년 06월 08일
발표자 한유진

Video


Overview

이 발표는 회귀 모델 분석의 핵심인 잔차(Residual) 및 잔차화의 개념을 소개하고, 임상 예측 모델의 실제적 유용성을 평가하는 의사결정 곡선 분석(DCA)의 원리와 해석 방법 및 한계를 설명합니다.

잔차(Residual) 및 잔차화(Residualization)의 이해

  • 실제 관측값과 모델 예측값 사이의 표본 오차를 통한 회귀 모델 적합도 평가 및 예측 패턴 탐지
  • 특정 변수의 영향을 제거하여 변수 간 독립적인 순수 효과(변동성)만 분리해 내는 잔차화 기법
  • 머신러닝 모델(트리 기반 등)에서 다중공선성 완화 및 개별 변수의 해석력 향상을 위해 활용
  • 선형 관계 가정에 따른 비선형 효과 제어 한계, 스케일 변화, 범주형 변수 적용 불가 등의 한계 존재

의사결정 곡선 분석(DCA) 도입 배경

  • 위양성(불필요한 개입)과 위음성(고위험군 누락)의 임상적 비용 차이를 반영하지 못하는 기존 모델 평가지표(AUROC 등)의 한계
  • 단순한 예측 정확도 측정을 넘어, 오진 위험과 치료 이득을 종합적으로 고려한 모델의 임상적 의사결정 유용성 평가 필요

DCA 핵심 지표 및 그래프 해석

  • 임계 확률(X축): 임상적 개입(검사, 치료 등)을 결정하는 위험도 기준으로 환자/의사의 위양성·위음성 상대적 선호도 반영
  • 순이익(Y축): 올바른 치료로 얻은 이득(TP)에서 불필요한 치료로 인한 손해(FP)에 임계 확률 기반의 가중치를 곱해 차감한 수치
  • 모두 치료(Treat All), 모두 미치료(Treat None), 예측 모델 적용 전략 중 특정 임계 확률 구간에서 가장 높은 순이익을 그리는 전략 도출

DCA의 주요 한계점

  • 잘 연구되지 않은 질환에서의 수용 가능한 임계 확률 및 위험 수준 범위 설정의 어려움
  • 금전적 지출, 시간 소모, 부작용 등 물리적이고 실제적인 임상 검사 및 치료 비용 미반영
  • 진단 후 이어지는 복잡한 다단계 치료 워크플로우 내에서의 추가적인 임상 정보 가치 반영 한계