3. 딥러닝 기초¶
이 장에서는 딥러닝의 기본적인 내용들을 소개합니다. 네트워크 아키텍처, 데이터, 손실 함수(loss functino), 최적화, 그리고 용량 제어를 포함합니다. 이해를 돕기 위해서, 선형 함수, 선형 회귀, 그리고 확률적 경사 하강법(stochastic gradient descent)과 같은 간단한 개념부터 시작합니다. 이것들은 softmax나 다층 퍼셉트론(multilayer perceptron)와 같은 보다 복잡한 개념의 기초가 됩니다. 우리는 이미 상당히 강력한 네트워크를 디자인할 수 있지만, 필수적인 제어나 기교는 배우지 않았습니다. 이를 위해서, 용량 제어, 오버피팅(overfitting)과 언더피팅(underfitting)에 대한 개념을 이해할 필요가 있습니다. 드롭아웃(dropout), 수치 안정화(numerical stability), 그리고 초기화에 대한 설명으로 이 장을 마무리할 예정입니다. 우리는 실제 데이터에 모델을 적용하는 방법에 집중하겠습니다. 이를 통해서 여러분은 기본 개념 뿐만 아니라 딥 네트워크를 실제 문제에 적용할 수 있도록 할 예정입니다. 성능, 확장성 그리고 효율성은 다음 장들에서 다룹니다.
- 3.1. 선형 회귀(Linear Regression)
- 3.2. 선형 회귀를 처음부터 구현하기
- 3.3. 선형 회귀의 간결한 구현
- 3.4. Softmax 회귀(regression)
- 3.5. 이미지 분류 데이터 (Fashion-MNIST)
- 3.6. Softmax 회귀(regression)를 처음부터 구현하기
- 3.7. Softmax 회귀(regression)의 간결한 구현
- 3.8. 다층 퍼셉트론 (Multilayer Perceptron)
- 3.9. 다층 퍼셉트론(multilayer perceptron)을 처음부터 구현하기
- 3.10. 다층 퍼셉트론(multilayer perceptron)의 간결한 구현
- 3.11. 모델 선택, 언더피팅(underfitting), 오버피팅(overfitting)
- 3.12. 가중치 감쇠 (weight decay)
- 3.13. 드롭아웃(dropout)
- 3.14. 순전파(forward propagation), 역전파(back propagation), 연산 그래프
- 3.15. 수치 안정성(numerical stability) 및 초기화
- 3.16. 환경
- 3.17. Kaggle의 주택 가격 예측하기