Summary
이미지의 모든 픽셀에 대해 “이 픽셀이 어떠한 클래스에 속하는가?” 를 예측.
즉, 같은 클래스에 속한 객체들은 모두 하나로 묶어서(class-wise) 분할.
Outputs
입력 이미지와 동일한 크기의 mask에 클래스 id
Example
- 자율주행차 영상 → 도로, 차, 사람, 신호등 등 장면 전체를 의미 단위로 구분
- 한 장에 사람이 3명 있어도 “person class”로 하나의 그룹으로 취급
Tip
대표 모델들로는,
- FCN(Fully Convolutional Networks)
- U-Net