Summary

이미지의 모든 픽셀에 대해 “이 픽셀이 어떠한 클래스에 속하는가?” 를 예측.
즉, 같은 클래스에 속한 객체들은 모두 하나로 묶어서(class-wise) 분할.

Outputs

입력 이미지와 동일한 크기의 mask에 클래스 id

Example

  • 자율주행차 영상 → 도로, 차, 사람, 신호등 등 장면 전체를 의미 단위로 구분
  • 한 장에 사람이 3명 있어도 “person class”로 하나의 그룹으로 취급

Tip

대표 모델들로는,

  • FCN(Fully Convolutional Networks)
  • U-Net