Summary

기존 Vision Transformer(ViT)의 경량화 버전.
키는 ViT에 CNN의 개념을 넣어서 convolution 연산으로 연산량을 줄인 것.

/

Introduction


Related Papers


Methods


Results


Discussion