DL - Theory #3 : Flow of Actiation function

Notice

Recent Posts

Tags more

Archives

관리 메뉴

s5unnyjjj's LOG

Artificial Intelligence/Deep Learning

s5unnyjjj 2022. 4. 1. 18:27

딥러닝 모델 구축에 사용되는 많은 activation function이 존재합니다.

해당 글에서는 activation function의 변천사에 대해서 간략히 설명하려고 합니다.

Sigmoid / Tanh(Hyperbolic Tangent)

ReLU(Rectified Linear Unit)

Leaky ReLU(Rectified Linear Unit)

Leaky ReLU는 x가 양수일 경우 ReLU와 동일하게 y=x를 따릅니다.
하지만 음수일 경우 ReLU의 한계점을 해결하기 위해 Leaky ReLU는 특정 기울기 만큼의 식을 따르게 되며 식으로 표현하면 y=ax(a<0)입니다. 기울기(a)는 조절할 수 있습니다.
하지만 y=ax는 직선형이다보니 음수부분이 bounded 되어있지 않기에 feature 학습에 부정적인 영향을 끼치게 됩니다.
이를 해결하기 위해 GeLU가 나타납니다.

GeLU(Gaussian Error Linear Unit)

>> 위 내용은 필자가 직접 작성한 내용입니다.

>> 부족한 점이 많을 수 있기에 잘못된 내용이나 궁금한 사항이 있으면 댓글 달아주시기 바랍니다.

>> 긴 글 읽어주셔서 감사합니다.

DL - Problem #7 : Dropout를 적용한 모델의 특정 node output 계산 (0)	2021.06.05
DL-Theory #1 : GD(Gradient Descent)의 변형 알고리즘 (0)	2021.05.16
DL - Problem #6 : Batch normalization를 이용한 특정 node의 output 계산 (0)	2021.05.14
DL - Problem #5 : GD(Gradient Descent)를 이용한 가중치 업데이트 (3) (0)	2021.05.11
DL - Problem #4 : GD(Gradient Descent)를 이용한 가중치 업데이트 (2) (0)	2021.05.11

'Artificial Intelligence/Deep Learning' Related Articles

Comments