일반적인 “learning” paradigm은 크게 다음 3가지 종류로 구분된다.
Learning?
학습이란 무엇일까?
Supervised Learning
Summary
한국어로 ‘supervised’ 는 보통 ‘지도’ 라고 변역되는데, 그래서 정답(label)이 있는 상태로 하는 학습을 일컫는다.
원본 링크Example
- Classification
- Regression
- LDA(Linear Discriminant Analysis) projection (dimension reduction)
- translation
- captioning,,,
Unsupervised Learning
Summary
정답 레이블이 없는 경우 하는 학습이다.
현실 데이터들은 레이블이 없는 경우가 대부분이니, 이에 더 적합하다.
비슷한 용어: representation learning, Dimension ReductionRepresentation Learning
unsupervised learning과 비슷한 맥락에서도 사용될 수 있지만, 조금 다름.
표현을 학습하는 건데, supervised fine-tuning 같은 것도 그렇게 분류 될 수 있으니,
완전 포함 관계는 아니고, 교집합이 있는 정보.데이터 차원을 줄이는 방법을 칭함.
즉, unsupervised이면서, representation learning임.dimension reduction 은 왜 해야 할까?
- Visualization
- Computer Resource
원본 링크Example
- Clustering
- factorization
- kernel estimation
- PCA(Principle Component Analysis) (representation learning, )
- AutoEncoder (representation learning)
Reinforcement Learning
Summary
Reward 라고 하는 값을 long-term으로 봤을 때 maximize 하도록 function을 학습하는 기법이다.
기본적인 paradigm은 Env(환경)에 Agent를 넣고 둘 간의 interaction을 보는 것이다.
주고 받는 정보는 아래와 같으며, agent가 action을 함으로써 state가 transition되고, env로부터 reward가 계산되며 계속 action을 하는 방향으로 학습된다.ex) games, Go, chess, etc…
원본 링크Important
long-term의 reward를 극대화하는 것이 목표이므로, 단기적 손실은 희생(sacrifice)한다.
Comparison
- 일단 셋 다 function을 학습한다.
- ML의 목적은 결국, 원하는 데이터를 잘 설명하는 function을 찾는 거니까.
→ model parameter in DL
- ML의 목적은 결국, 원하는 데이터를 잘 설명하는 function을 찾는 거니까.
