Summary

모델에 넣기 직전까지 데이터를 construction.

Structed vs Unstructed

Data Representation

Summary

이전에 본 듯이, input data의 distribution이 고르게 분포하지 않을 경우,
gradient 가 fluctuate될 수 있다. → inefficient

The problem of covariate shifts



Training 과정에서 우리는 일반적으로 데이터셋이 비슷한 분포에서 나왔다고 가정하는데,
mini-batch 로 학습하는 경우에는 이 단위가 mini-batch에도 적용된다.
그러나, 그렇지 않을수도 있다. (전체 데이터가 한 번에 모델에 입력되어 iteration하는게 아니니까.)




Data preprocessing Example


Original Data

Multi column

Zero-centered with

Normalized with

Decorrelateed

  • Multiply with eigenvectors of covariance matrix

Whitened

  • Divide by sqrt of eigenvalues of covariance matrix

Tip