Introduction


  • Retrieval-augmented LM이 자신이 모를 때 적절히 거부하는지 조사
  • Over-refusal 문제 발견 및 분석

Related Papers


  • RAG
  • Selective prediction

Methods


  • 다양한 knowledge state(relevant/irrelevant retrieved docs)에서 calibration 평가
  • Refusal ability와 calibration quality의 관계 분석
  • Uncertainty-based abstention과 refusal의 결합

Results


  • Irrelevant document만 있을 때도 RALM이 답할 수 있는 질문을 거부하는 over-refusal 발견
  • Refusal 개선이 반드시 calibration이나 accuracy 향상을 의미하지 않음

Discussion


  • RAG 환경에서의 self-knowledge 복잡성
  • Refusal과 calibration의 독립성