Residuals & Deicision Curve Analysis
Information
| 일자 | 2026년 06월 08일 |
|---|---|
| 발표자 | 한유진 |
Video
Overview
이 발표는 회귀 모델 분석의 핵심인 잔차(Residual) 및 잔차화의 개념을 소개하고, 임상 예측 모델의 실제적 유용성을 평가하는 의사결정 곡선 분석(DCA)의 원리와 해석 방법 및 한계를 설명합니다.
잔차(Residual) 및 잔차화(Residualization)의 이해
- 실제 관측값과 모델 예측값 사이의 표본 오차를 통한 회귀 모델 적합도 평가 및 예측 패턴 탐지
- 특정 변수의 영향을 제거하여 변수 간 독립적인 순수 효과(변동성)만 분리해 내는 잔차화 기법
- 머신러닝 모델(트리 기반 등)에서 다중공선성 완화 및 개별 변수의 해석력 향상을 위해 활용
- 선형 관계 가정에 따른 비선형 효과 제어 한계, 스케일 변화, 범주형 변수 적용 불가 등의 한계 존재
의사결정 곡선 분석(DCA) 도입 배경
- 위양성(불필요한 개입)과 위음성(고위험군 누락)의 임상적 비용 차이를 반영하지 못하는 기존 모델 평가지표(AUROC 등)의 한계
- 단순한 예측 정확도 측정을 넘어, 오진 위험과 치료 이득을 종합적으로 고려한 모델의 임상적 의사결정 유용성 평가 필요
DCA 핵심 지표 및 그래프 해석
- 임계 확률(X축): 임상적 개입(검사, 치료 등)을 결정하는 위험도 기준으로 환자/의사의 위양성·위음성 상대적 선호도 반영
- 순이익(Y축): 올바른 치료로 얻은 이득(TP)에서 불필요한 치료로 인한 손해(FP)에 임계 확률 기반의 가중치를 곱해 차감한 수치
- 모두 치료(Treat All), 모두 미치료(Treat None), 예측 모델 적용 전략 중 특정 임계 확률 구간에서 가장 높은 순이익을 그리는 전략 도출
DCA의 주요 한계점
- 잘 연구되지 않은 질환에서의 수용 가능한 임계 확률 및 위험 수준 범위 설정의 어려움
- 금전적 지출, 시간 소모, 부작용 등 물리적이고 실제적인 임상 검사 및 치료 비용 미반영
- 진단 후 이어지는 복잡한 다단계 치료 워크플로우 내에서의 추가적인 임상 정보 가치 반영 한계