딥러닝 기본
기본:
1. 딥러닝은 기존의 방법론과 다르게 Data Driven Approch라는 것이다.
2. 사람이 손으로 계산하는 feature를 가져오는것이 아니라 데이터로 부터 강력한 feature들을 가져온다는 것이다.
3. 딥러닝의 기본적인 가능성은 데이터(빅데이터), 하드웨어(GPU), 소프트웨어(프레임워크)가 이를 받쳐주기 때문이다.
structure -> Standard 계열
image -> CNN 계열
sequential -> RNN 계열
- Perceptron 에 bias가 존재하는 이유는? -> 다양한 표현을 위해서이다. y=ax+b가 되어야 b로인해 평행이동이 가능하기에 더 일반적인 표현이 가능하다.
전체적인 흐름은 위의 그림을 보자
Inputs 과 Weights들의 행렬곱을 합한뒤 Activation function을 거쳐 output을 배출하는 것이다.
대표적인 activation functions에는 sigmoid, Hyperbolic Tangent, ReLU, 이를 응용한 다양한 활성화 함수들이 있는데 각자의 특징에 대해서는 다음에 한번더 다뤄보도록 하겠다.
여기서 중요한것은 이 함수들이 모두 '비선형성'을 갖고있기에 표현을 일반적으로 할 수 있다는 것이다.
전체적인 흐름은 밑의 그림을 보자
여기서 Architecture를 모델이라고 생각하면 된다.
다음시간에는 간단한 선형대수에 대해 다뤄보도록 하겠다.
참고:성균관대학교 Artificial Intelligence (COM3022) | Lecture2 | Spring 2023 | 이장원