Summary

LLM 성능 지표지만, 특히나 RAG에서 중요하게 다뤄지는 지표.
모델이 제공된 context를 바탕으로 user의 query에 얼마나 완전히/충실히 해결했는지 평가.

  • 단순히 정확도가 아니라, 질문의 모든 요구사항을 완수했는지 등이 포함됨.