ConvNet의 활용 예

June 13, 2019

해당 게시물은 Edwith에서 제공하는
머신러닝과 딥러닝 BASIC을 듣고 요약 정리한 글입니다.

LeNet-5

Lecun et al (1998)
손으로 쓴 $32 \times 32$ 크기의 글씨 이미지를 학습
Filter로 $5 \times 5$ 크기의 Filter로 1의 크기의 Stride사용
Pooling을 진행할 때 $2 \times 2$ 크기와 2의 크기의 Stride사용
아직 안만듬

AlexNet

Krizhevsky et al (2012)

아직 안만듬

입력값 : $227 \times 227 \times 3$ 의 컬러 이미지
첫번째 Layer : CNN (96개의 $11 \times 11$ 크기, Stride가 4인 Filter)
출력값의 크기: $55 \times 55 \times 96$
첫 번쨰 Layer의 Parameter : $(11 \times 11 \times 3) \times 96 = 35K$

두 번쨰 Layer : Pooling Layer( $3 \times 3$ 크기, Stride가 2인 Filter)
출력값의 크기 : $27 \times 27 \times 96$
두 번째 Layer의 Parameter : 0

AlexNet의 Full Architecture

[ $227 \times 227 \times 3$ ] INPUT
[ $55 \times 55 \times 96$ ] CONV1
- $11 \times 11$ 크기의 Filter 96개
- Stride : 4
- pad : 0
[ $27 \times 27 \times 96$ ] MAX POOL1
- $3 \times 3$ 크기의 Filter
- Stride : 2
[ $27 \times 27 \times 96$ ] NORM1
- Normalization layer
[ $27 \times 27 \times 256$ ] CONV2
- $5 \times 5$ 크기의 Filter 256개
- Stride : 1
- pad : 2
[ $13 \times 13 \times 256$ ] MAX POOL2
- $3 \times 3$ 크기의 Filter
- Stride : 2
[ $13 \times 13 \times 256$ ] NORM2
- Normalization layer
[ $13 \times 13 \times 384$ ] CONV3
- $3 \times 3$ 크기의 Filter 384개
- Stride : 1
- pad : 1
[ $13 \times 13 \times 384$ ] CONV4
- $3 \times 3$ 크기의 Filter 384개
- Stride : 1
- pad : 1
[ $13 \times 13 \times 256$ ] CONV5
- $3 \times 3$ 크기의 Filter 256개
- Stride : 1
- pad : 1
[ $6 \times 6 \times 256$ ] MAX POOL3
- $3 \times 3$ 크기의 Filter
- Stride : 2
[ $4096$ ] FC6
- 4096 neurons
[ $4096$ ] FC7
- 4096 neurons
[ $1000$ ] FC8
- 1000 neurons (class scores)