본문으로 건너뛰기

Juhyeon's Blog

❯

❯

❯

❯

Do Retrieval Augmented Language Models Know When They Dont Know

Do Retrieval Augmented Language Models Know When They Dont Know

2026년 2월 11일1분 분량

Introduction

Retrieval-augmented LM이 자신이 모를 때 적절히 거부하는지 조사
Over-refusal 문제 발견 및 분석

Related Papers

RAG
Selective prediction

Methods

다양한 knowledge state(relevant/irrelevant retrieved docs)에서 calibration 평가
Refusal ability와 calibration quality의 관계 분석
Uncertainty-based abstention과 refusal의 결합

Results

Irrelevant document만 있을 때도 RALM이 답할 수 있는 질문을 거부하는 over-refusal 발견
Refusal 개선이 반드시 calibration이나 accuracy 향상을 의미하지 않음

Discussion

RAG 환경에서의 self-knowledge 복잡성
Refusal과 calibration의 독립성

공유하기

그래프 뷰

Introduction
Related Papers
Methods
Results
Discussion

Properties

Author: Youchao Zhou et al.
Comment: RAG 환경에서 LLM이 "모를 때 모른다"를 아는지 조사 - over-refusal 문제와 calibration 관계 분석
IsTargetPaper: true
Journal/Conference: arXiv
Published Year: 2025
Reading Status: Not Started
Review Date: 2026-02-01
Topic: RALM self-knowledge, over-refusal, calibration, abstention
URL: https://arxiv.org/abs/2509.01476

백링크

Architecture
Fundamentals
LLMs
Memory
self-consciousness
Unlabeled
Vision

Created with Quartz v4.5.2 © 2026

GitHub
Blog