Summary

LLM response가 얼마나 fact 인지 나타내는 measure.

  • factuality가 낮다 == 높은 hallucination

model의 output quality와 꽤 강한 상관을 보인다.

Question

model output quality:

  • 종합적으로 보는 지표인 듯.
  • fluency, helpfulness, honest, harmless 등과 관련이 있다고 함.