Todo
- task: 위 spectrum을 가지고 ‘welcome’ 발화 부분 segmentation
by using MLP...
이렃게 trivial 하게 전 영역을 MLP하면 되겠지만, 문제는
이렇게 데이터가 주어진다면,
- 위 사진의 데이터로만 학습하면 target이 다른 위치에 있는 즉, 아래 사진의 경우를 예측하기 힘들다.
- 또한, NN의 size도 크고, 연산량이 너무 많이 필요할 뿐더러, 다른 위치에 target이 등장하는 데이터가 발생하면 재학습해야 한다.
Important
결국 우리가 원하는 건, translation에 무관하게 잘 예측하는 분류기!
→ translation에 무관하게 : Shift Invariance
Scan
Summary
작은 MLP를 window크기 만큼 움직이며, scan.
이후 max 통과 시키면 있었는지 여부는 확인할 수 있겠지.
아님 task에 따라 max 대신, softmax, MLP 등을 붙일수도 있겠지



