Introduction
- Retrieval-augmented LM이 자신이 모를 때 적절히 거부하는지 조사
- Over-refusal 문제 발견 및 분석
Related Papers
- RAG
- Selective prediction
Methods
- 다양한 knowledge state(relevant/irrelevant retrieved docs)에서 calibration 평가
- Refusal ability와 calibration quality의 관계 분석
- Uncertainty-based abstention과 refusal의 결합
Results
- Irrelevant document만 있을 때도 RALM이 답할 수 있는 질문을 거부하는 over-refusal 발견
- Refusal 개선이 반드시 calibration이나 accuracy 향상을 의미하지 않음
Discussion
- RAG 환경에서의 self-knowledge 복잡성
- Refusal과 calibration의 독립성