본문 바로가기
교재 리뷰/파이토치 첫걸음

파이토치 첫걸음 - 5. 합성곱 신경망

by 펄서까투리 2019. 11. 18.

# 세줄요약 #

  1. 합성곱 신경망(Convolutional Neural Network): 하나의 필터가 이미지를 훑으며 필터와 일치하는 특성을 추출하는 것을 합성곱 연산이라 하며, 연산이 끝나면 이미지에 대한 특성지도(feature map)가 나오고 이러한 특성들이 중첩되면 더 복잡하고 다양한 형태를 구분할 수 있다.
  2. 합성곱 연산을 수행할 때 입력값의 크기를 유지하며 충분한 특성을 뽑기위해 패팅(padding)을 쓰고, 해상도가 충분할 때 이미지 메모리를 줄이고 넓은 시야에서 필터를 적용하기 위해 풀링(pooling)이라는 기법을 사용한다.
  3. 따라서 합성곱 연산이 합성곱 레이어(Convolutional Layer)를 지나며 이루어지면 이미지의 가로, 세로는 줄어들고 채널의 수는 늘어나게 되며, 모든 레이어를 거치며 충분히 특성을 뽑고 나면 완전연결레이어(Fully Connected Layer)로 특성들을 모두 펼친 뒤에 이미지를 최종분류한다.

A CNN sequence to classify handwritten digits [Ref. https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53]

 

이미지넷 대회 정확도의 변화 [출처: https://medium.com/@Lidinwise/the-revolution-of-depth-facf174924f5]

 

VGG16 모델의 구조 [출처: https://neurohive.io/en/popular-networks/vgg16/]

 

GoogleNet(Inception v1) 모델의 구조 [출처: https://medium.com/coinmonks/paper-review-of-googlenet-inception-v1-winner-of-ilsvlc-2014-image-classification-c2b3565a64e7]

 

ResNet 모델의 구조 [출처: https://medium.com/@pierre_guillou/understand-how-works-resnet-without-talking-about-residual-64698f157e0c]

 

 

* 출처: 파이토치 첫걸음 / 최건호 / 한빛미디어

728x90
728x90

댓글