Introduction
- LLM abstention(답변 거부)에 대한 포괄적 서베이
- Query, model, human values 세 관점의 framework 제시
Related Papers
- Selective prediction
- Hallucination mitigation
- LLM safety
Methods
- Abstention 방법론, 벤치마크, 평가 지표를 framework으로 정리
- Meta-capability로서의 abstention 가능성 논의
Results
- 기존 abstention 연구의 체계적 분류
- 방법별 장단점 비교
Discussion
- Abstention을 task/domain을 초월하는 meta-capability로 볼 수 있는지
- Self-knowledge와 abstention의 관계