Attention 종류들 정리

각 항목은 대표 논문 노트로 wikilink 되어 있다.

HW-bottleneck (메모리/IO 효율)

Computational Efficiency (O(N²) → O(N))

Sparse (Pattern Constraint)

Multi-head 변형 (Head 수 조절)

Causal / Decoder 전용 (Autoregressive 효율)


허브 / 크로스 레퍼런스