반응형
오늘 소개할 논문은 Wang et al.의 2016년 연구인 "Algorithmic Principles of Remote PPG" 입니다. 이 논문은 실질적으로 POS(Plane-Orthogonal-to-Skin) 알고리즘의 탄생 배경과 수학적 원리를 정립하며 rPPG 연구의 이정표가 된 매우 중요한 논문입니다.
Algorithmic Principles of Remote PPG
This paper introduces a mathematical model that incorporates the pertinent optical and physiological properties of skin reflections with the objective to increase our understanding of the algorithmic principles behind remote photoplethysmography (rPPG). Th
ieeexplore.ieee.org
🎯 연구의 목적
- 이 논문은 단순히 "심박 추정 정확도가 높다"는 것을 보여주기 위한 연구가 아닙니다. 오히려 다음과 같은 근본적인 질문에서 출발합니다:
- "rPPG에서 심박 신호는 RGB 채널로부터 어떤 수학적 방식으로 추출되는가? 이론적으로 왜 그렇게 되는가?"
- 즉, 이 논문은 rPPG 알고리즘들이 실제로 어떤 원리로 작동하며, 왜 어떤 상황에서 잘 작동하고 어떤 상황에서 실패하는지를 광학적, 생리학적 모델을 기반으로 해석하려고 합니다. 그리고 그 통찰을 바탕으로 새로운 방법인 POS 알고리즘을 제안합니다.
🔬 핵심 개념: 피부 반사의 물리 모델
- 논문에서는 피부 반사를 2가지로 나누어 설명합니다:
- Specular Reflection (정반사): 피부 표면에서 반사되는 광, 심박 정보 없음
- Diffuse Reflection (난반사): 혈관 속으로 들어갔다 나오는 광, 심박 정보 포함
- 카메라가 측정하는 RGB 신호는 다음과 같은 수식으로 표현됩니다:
- $C(t) = I(t) \cdot (v_{s}(t)+v_{d}(t))+v_{n}(t)$,
- $v_{s}(t)$: 정반사
- $v_{d}(t)$: 난반사
- $v_{n}(t)$: 노이즈
-
이 중 심박수는 난반사($v_{d}(t)$)의 미세한 색 변화($u_{p}(t)$)에 포함되어 있습니다. 따라서, 심박 정보를 추출하려면 이 성분만을 분리해야 하는 것입니다.
- $C(t) = I(t) \cdot (v_{s}(t)+v_{d}(t))+v_{n}(t)$,
📚 기존 알고리즘 분석
- BSS 계열 (ICA / PCA)
- RGB의 시간 시퀀스를 통계적으로 분리
- 문제점:
- 노이즈와 심박이 모두 주기적이면 구분 불가 (예: 운동 중)
- 어떤 성분이 심박인지 사후에 판단해야 함 (black-box 방식)
- CHROM (2013)
- 정규화된 피부색 벡터에 기반해, 정반사 방향과 수직인 평면에 투사
- 투사된 두 성분의 위상 차이(in-phase/anti-phase)를 이용하여 심박 추출
- 장점: 모션에 강함, 색상 기반 정규화로 다양한 피부색 대응 가능
- 단점: 가정된 피부색 벡터(표준화 피부색)가 실제와 다르면 정확도 감소
- PBV (2014)
- 혈류 변화 시 RGB 채널별 반응 비율을 blood volume pulse vector (PBV)로 정의
- 이를 기반으로 RGB 공간에서 심박 방향을 추정하여 가장 심박과 유사한 방향으로 투사
- 장점: 모션에 매우 강건함
- 단점: 카메라, 조명 환경에 민감함 (PBV가 환경 따라 달라짐)
💡 POS (Plane-Orthogonal-to-Skin) 알고리즘
- 핵심 아이디어
- "피부의 색 변화는 전체 밝기 변화(조명, 움직임)에 비례하지만, 심박은 RGB 채널별로 특정 비율로만 나타난다."
- 따라서, 전체 밝기 방향(1,1,1)에 수직인 평면을 기준으로 신호를 투사하면,
- 밝기 변화는 제거
- 심박 성분은 보존
- 이를 POS 평면이라고 부릅니다. 이 평면 안에서 가장 심박에 민감한 방향을 실시간으로 찾아냅니다.
⚙️ POS 알고리즘 구조
- ROI 평균 RGB 시계열 추출
- 정규화 (mean normalization)
- 투사 평면 설정: (1,1,1)에 수직이고, G>B>R 순서 고려
- 두 방향으로 투사한 신호 결합:
- $S_{1}=G-B$, $S_{2}=G+B-2R$
- $h(t)=S_{1} + \alpha \cdot S_{2}$, where $\alpha=std(S_{1})/std(S_{2})$
- 슬라이딩 윈도우로 추정값 누적합산
- 최종 심박 신호 $H(t)$ 생성
🔬 성능 비교 (벤치마크 실험)
- 60개의 비디오, 다양한 조건 (정지, 조명 변화, 운동 후 회복, 피트니스 운동 등)에 대해 총 8개의 알고리즘을 비교했습니다.
- 정적 조건에서는 CHROM, 2SR, POS가 우수
- 운동 중(피트니스)에서는 PBV와 POS가 강력
- POS는 전반적으로 가장 우수한 평균 성능을 기록

✅ 결론 및 시사점
- POS는 기존의 CHROM, PBV 방식의 장점을 결합한 모델
- 수학적 모델에 기반하여 직관적이면서도 안정적인 알고리즘을 구현
- 조명, 움직임, 피부색 변화 등 실환경에서의 적용 가능성이 매우 높음
- 구현이 단순하면서도 연산량이 적어 실시간 시스템에도 적합
📝 마무리
- 이 논문은 rPPG 연구의 핵심 알고리즘들을 수학적 모델로 통합적으로 이해하고, 그 위에 POS라는 새롭고 실용적인 알고리즘을 제안했다는 점에서 학문적, 실용적 모두의 측면에서 매우 중요한 연구입니다.
반응형