PulseLM: A Foundation Dataset and Benchmark for PPG-Text Learning

2026-04-27 | Views:

일자	2026년 04월 27일
발표자	진재욱

이 발표는 여러 환경에서 수집된 15개의 공개 PPG 데이터셋을 통합하여 대규모 질문-답변(QA) 형태의 벤치마크를 구축하고, 생체 신호와 텍스트를 결합한 멀티모달 파운데이션 모델의 가능성을 제시한 PulseLM논문을 소개합니다.

연구 배경 및 기존 PPG 모델의 한계

PulseLM 데이터셋 구축 및 정제 과정

멀티모달 모델 아키텍처 및 퓨전 기법

실험 결과 및 향후 과제

뚜렷한 리듬 패턴 테스크(심방세동, 부정맥 등)에서의 대형 모델(4B, 8B) 고성능 확인
심박수(HR)의 높은 일반화 성능 및 파형 형태에 민감한 혈압(BP)의 도메인 시프트(Domain Shift) 취약성 확인
질문 자동 생성에 따른 언어적 편향(Linguistic bias) 존재 및 폐쇄형 구조의 임상 진단 대체 한계
향후 개방형(Open-ended) 리포트 생성, 전문가 검증 어노테이션 도입, 멀티모달 표현 학습(Representation Learning)으로의 확장 계획