# 세줄요약 #
- Dataset Includes 796 patient have pathology-confirmed diagnosis(from CT-guided biopsy) and high-resolution CT imaging data at one institution between 2012 and 2017.
- To avoid overfitting on small dataset, Transfer learning to train a network using open dataset(LIDC) and added three new untrained layers.
- These study using only 86 patients, because Lesion location was manually determined using the biopsy guidance CT scan, so the result is AUC of 0.70 and classification accuracy of 71%.
# 상세 리뷰
1. 데이터셋
- 한 기관에서 2012년부터 2017년까지 796명의 환자에 대해 고해상도의 CT 영상 데이터와 함께 병리학 기반으로 진단한 조직검사 Ground Truth(Benign/Malignant)를 가진 데이터셋
- 따라서 기존 연구들에서 Lung RADS를 기준으로 영상의학의들이 판단한 기준과 달리 정확히 폐 결절의 악성/양성 여부를 판단할 수 있기에 가치가 있는 데이터셋이다.
- 그러나 병변 위치를 AI를 이용해 찾지 않고(Segmentation of Detection) 결절 위치를 직접 사람이 찾아서 Patch Extraction을 하였기에 실제 사용한 환자수는 86명 밖에 되지 않는다.
- Traing Set: 65명 (72% Malignant, 28% Benign)
- Test Set: 21명 (72% Malignant, 28% Benign)
2. 신경망 학습
- 데이터 갯수가 너무 적기에 Overfitting을 피하기 위해서 Transfer learning을 사용하려 하는데 문제는 이 논문의 데이터셋처럼 조직검사 기반의 다른 폐결절 데이터셋이 존재하지 않는 것이다(기존의 LIDC, LUNA 데이터셋 모두 영상의학의들이 판단한 레이블 사용).
- 따라서 유사한 데이터셋이라도 사용하기 위하여 LIDC를 학습한 3D-CNN을 BackBone으로 가져온 후에 그 뒤에 Spatial pooling, Dense, Softmax 층 정도만 더해서 논문의 데이터셋으로 재학습시켰다.
- 전처리에 대한 언급은 없는 것으로 보아 특별히 Lung Segmentation, CLAHE 같은 기법들은 사용하지 않은 것으로 보인다. 결절 부분만 64x64x64 사이즈로 Patch Extraction한 것이 전부로 보인다.
- 학습에 사용된 하이퍼 파라미터는 다음과 같다.
- Class Weight = 10:1 (benign, Maligant)
- Optimizer = Adam
- Learning Rate = 1e-3
- Training Epoch = 2000 steps
3. 학습 결과
- AUC: 0.70
- Acc: 71%
논문 제목에 Pilot Study라 명시한 이유가 아마도 전체 데이터셋(796)을 다 사용하지 못하고서 우선 86명의 환자로만 낸 결과라 성능이 낮아서 그런 것 같다. 796 데이터셋을 모두 사용한다면 분명 성능 향상이 있을 것으로 보이고 논문의 필자들 또한 Conclusion 파트에서 언급하고 있다.
* Reference: Lindsay W., Wang J., Sachs N., Barbosa E., Gee J. (2018) Transfer Learning Approach to Predict Biopsy-Confirmed Malignancy of Lung Nodules from Imaging Data: A Pilot Study. In: Stoyanov D. et al. (eds) Image Analysis for Moving Organ, Breast, and Thoracic Images. RAMBO 2018, BIA 2018, TIA 2018. Lecture Notes in Computer Science, vol 11040. Springer, Cham. https://doi.org/10.1007/978-3-030-00946-5_29
728x90
728x90
댓글