본문 바로가기
논문 리뷰/의료영상

Furukawa et al., 2022, A comprehensible machine learning tool to differentially diagnose idiopathic pulmonary fibrosis from other chronic interstitial lung diseases

by 펄서까투리 2023. 8. 28.

# 세줄 요약 #

  1. 특발성 폐 섬유증(Idiopathic pulmonary fibrosis; 이하 IPF)은 환자의 예후가 좋지 않으면서 다학제(multidisciplinary) 간의 진단 정확도 마저 낮기에, 이번 연구에서는 환자의 위험을 유발하는 수술이 배제된 비침습적(non-invasive) 데이터들을 활용하여 딥러닝과 머신러닝이 결합된 알고리즘으로, 보통의 간질성 폐질환(interstitial lung diseases; 이하 ILD)로부터 IPF 환자를 분류하였다.
  2. 이번 연구는 후향적(retrospectively) 연구로 2007년 4월부터 2017년 7월 사이에 ILD로 진단된 환자들의 데이터(총 1068명의 ILD 환자 중 42.7%가 IPF 진단)를 모았으며, 딥러닝은 HRCT 영상에서 병변을 검출하여 분할(segmentation)하는데 사용되었으며, 이후 머신러닝으로 딥러닝 분할 결과와 다양한 비침습적 임상 데이터(clinical data)들을 학습하여 IPF를 진단하도록 하였다.
  3. 그 결과 딥러닝 기반의 분할 성능은 평균 정확도(pixel accuracy) 96.1%, 머신러닝 알고리즘의 진단 정확도는 83.6%였으며, Cox hazard 분석을 한 결과(hazard ratio: 2.593), 이 알고리즘 사용하여 진단된 IPF는 환자에게 중요한 예후 인자임을 보였다.

 

# 상세 리뷰 #

1. Introduction

  • 간질성 폐질환 (Interstitial lung disease; 이하 ILD)은 다양한 예후와 그에 따른 여러 관리를 필요로 하는 폐기능 장애로, 여러 ILD 중에서도 특발성 폐 섬유증 (idiopathic pulmonary fibrosis; IPF)은 만성적이면서 점진적으로 악화되는 섬유성 폐질환으로, 여전히  병인이 잘 알려지지 않았고 예후 또한 제한적이라 환자에게 매우 치명적인 병변이다.
  • 하지만 이러한 ILD의 진단은 호흡기 내과 전문의에게 어려운 일로, 일반적인 ILD의 진단 표준(gold standard)은 임상의(clinician), 영상전문의(radiologist), 병리과 의사(pathologist) 간의 합의를 통해 진단을 도출해내는 다학제간 토론(multidisciplinary discussion; 이하 MDD; 국제 평균 Cohen's kappa coefficient: ~0.60)인데, 이는 전문가들의 인력을 생각했을 때 모든 환자들에게 적용하여 진단하기에는 불가능하다 (* 마찬가지로 Surgical lung biopsy (SLB) 또한 ILD를 정확하게 진단할 수 있으나, 진단을 위해 매번 환자에게 수술을 권할 수는 없다).
  • 따라서 IPF 진단에 단서를 제공하는 HRCT 영상을 활용한 분류 알고리즘이 개발되어 왔으나(* MDD나 SLB를 사용하지 않고), 이전 연구에서는 HRCT의 패턴들만 효과적으로 분류(~73% accuracy)할 뿐 직접적인 ILD 진단을 하지는 않았기에, 저자들은 이번 연구에서 딥러닝을 이용하여 ILD에 특화된 패턴(예. honeycombing)과 함께 비침습적(non-invasive) 임상 데이터들을 사용해 IPF를 정확하게 분류하는 알고리즘을 개발하였다.  

 

2. Methods

  • 저자들은 후향적으로 의료 기록을 분석하여, 일본에서 2007년 4월부터 2017년 3월까지 2018 IPF 가이드라인을 따라 MDD로 진단한 만성적인 ILD 환자 1068명의 데이터(IPF 환자는 42.7%: 456명)를 모았으며, 그 중에서 통상 간질성 폐렴(usual interestitial pneumonia; 이하 UIP) 환자는 두명의 임상의(경력: 각각 21년, 33년)가 2018 HRCT criteria를 기준으로 분류하였다.

  • 이렇게 모은 환자들의 채혈 검사, 폐 기능 검사, 환자 정보와 CT 영상들을 데이터로 수집하였으며, HRCT 영상에는 segmentation 학습을 위해 10년 경력의 임상의가 IPF로 의심되는 패턴(ex. honeycombing, reticular pattern)과 IPF가 아닌 패턴(ex. consolidation, ground-glass opacity(GGO), diffuse nodules or cyst)을 나누어 레이블(labeling)하였다.
  • 머신러닝/딥러닝 학습 전략은 두단계로 이루어진다: 1) HRCT 영상에서 ILD 의심 병변을 segmentation하는 것은 딥러닝 알고리즘으로 FCN-Alexnet 신경망 모델을 사용하였으며, 2) 머신러닝 알고리즘은 앞서 segmantation 모델이 구한 결과에서, 폐를 중심에서부터 반지름이 점점 커지는 5개의 타원체로 나누고(그림 1 참고), 각 영역별로 병변의 면적 비율을 구한 뒤에 앞서 수집한 추가적인 임상데이터(예. 채혈 검사, 폐기능 검사, 환자 정보)들을 합쳐서, 서포트 벡터 머신(support vector machine; 이하 SVM)으로 IPF를 분류하도록 학습시켰다 (* 훈련할 때 five-fold cross validation 기법을 사용하여 학습).

Figure 1. Examples of semantic segmentation results and elliptically distributed labeled images. (A) A labeled image is generated by the trained algorithm. Red and blue areas are suggestive of IPF and non-IPF, respectively. (B) A labeled image generated from the semantic segmentation is elliptically distributed area. [* Ref. Furukawa et al., 2022]

 

 

3. Results

  • Semantic segmentation 학습 결과(5-fold cross validation), 평균 테스트 정확도(pixel accuracy)는 96.1%에 달했고, 이후 IPF 진단 정확도는 1) 분할 결과만 사용했을 때는 평균 정확도 65.3%, 2) 그림 1 (B)와 같이 타원체로 영역을 나누어 IPF/nonIPF 영역의 비율을 추가했을 때는 평균 정확도 79.7%, 3) 마지막으로 임상데이터까지 모두 더해 함께 학습한 결과는 평균 정확도 83.6% 였다.

[* Ref. Furukawa et al., 2022]

  • Cox hazard analysis 결과, 머신러닝 알고리즘 기반으로 진단된 IPF(AI-IPF)는 HR(hazard ratio) 값이 2.634로 나와 MDD 기반으로 진단된 IPF(MDD-IPF; HR = 2.711)와 거의 동일한 수준으로 환자에게 중요한 예후 인자임을 알 수 있고, 또한 AI-IPF는 AI-non-IPF와 비교하면 훨씬 더 나쁜 생존률(AI-non-IPF: 2.213 HR -> AI-IPF: 2.634 HR)과 상대적으로 더 많은 honeycomb 패턴이 보이는 것도(AI-non-IPF: 35.2% -> AI-IPF: 69.0%) 확인할 수 있었다.

[* Ref. Furukawa et al., 2022]
Figure 2.  Kaplan–Meier curve showing survival differences between IPF and non-IPF diagnosed by MDD and the AI. [* Ref. Furukawa et al., 2022]

  • 마지막으로 SLB(Surgical Lung Biopsy)로 진단된 IPF 환자들에 대해서는 훨씬 더 높은 정확도를 보여서, 환자들 중에 UIP 패턴이 HRCT 영상이나 조직병리(histopathology) 영상에서 보이는 환자들의 경우 AI 기반의 진단 정확도가 87.5%까지 나왔다.

 

 

* Reference: Furukawa, Taiki, et al. "A comprehensible machine learning tool to differentially diagnose idiopathic pulmonary fibrosis from other chronic interstitial lung diseases." Respirology 27.9 (2022): 739-746.

728x90
728x90

댓글