일반적인 “learning” paradigm은 크게 다음 3가지 종류로 구분된다.

Learning?

학습이란 무엇일까?

Supervised Learning

Summary

한국어로 ‘supervised’ 는 보통 ‘지도’ 라고 변역되는데, 그래서 정답(label)이 있는 상태로 하는 학습을 일컫는다.

Example

원본 링크

Unsupervised Learning

Summary

정답 레이블이 없는 경우 하는 학습이다.
현실 데이터들은 레이블이 없는 경우가 대부분이니, 이에 더 적합하다.
비슷한 용어: representation learning, Dimension Reduction

Representation Learning

unsupervised learning과 비슷한 맥락에서도 사용될 수 있지만, 조금 다름.
표현을 학습하는 건데, supervised fine-tuning 같은 것도 그렇게 분류 될 수 있으니,
완전 포함 관계는 아니고, 교집합이 있는 정보.

데이터 차원을 줄이는 방법을 칭함.
즉, unsupervised이면서, representation learning임.

dimension reduction 은 왜 해야 할까?

  • Visualization
  • Computer Resource

Example

원본 링크

Reinforcement Learning

Summary

Reward 라고 하는 값을 long-term으로 봤을 때 maximize 하도록 function을 학습하는 기법이다.
기본적인 paradigm은 Env(환경)에 Agent를 넣고 둘 간의 interaction을 보는 것이다.
주고 받는 정보는 아래와 같으며, agent가 action을 함으로써 state가 transition되고, env로부터 reward가 계산되며 계속 action을 하는 방향으로 학습된다.

ex) games, Go, chess, etc…

Important

long-term의 reward를 극대화하는 것이 목표이므로, 단기적 손실은 희생(sacrifice)한다.

원본 링크

Comparison


  • 일단 셋 다 function을 학습한다.
    • ML의 목적은 결국, 원하는 데이터를 잘 설명하는 function을 찾는 거니까.
      → model parameter in DL