Introduction
- 기존 LLM 추론 방법은 수학/코딩 등 ground-truth가 있는 과제에서는 뛰어나지만, 타인의 정신 상태 추적처럼 정답이 없는 시나리오에서는 어려움
- Sequential Monte Carlo 알고리즘에서 영감을 받아, thought-tracing 추론 알고리즘 제안
- Bayesian theory-of-mind framework를 기반으로, LLM이 확률적 추론을 근사하여 에이전트의 변화하는 정신 상태를 추적
- 기존 LLM 추론: chain-of-thought, tree-of-thought 등 → ground-truth 기반 검증에 의존
- Bayesian Theory of Mind (BToM) 프레임워크
Methods
- Thought-Tracing: 특정 에이전트의 정신 상태를 추적하기 위한 inference-time 추론 알고리즘
- 가설(hypothesis)을 생성하고, 관측(observation)에 기반하여 가중치를 부여
- Ground-truth solution 없이 작동: 데이터셋의 정답에 의존하지 않음
- LLM을 활용하여 에이전트의 인식(perception)과 행동(action)에 기반한 정신 상태의 확률적 추론을 근사
Results
- 다양한 ToM 벤치마크에서 baseline LLM 대비 유의미한 성능 향상
- o3, R1 등 최신 reasoning 모델의 ToM 과제에서의 흥미로운 행동 패턴 발견
- 사회적 추론(social reasoning)이 다른 도메인과 근본적으로 다름을 보여줌
Discussion
- Bayesian inference를 inference-time에 근사하는 접근이 ToM 추론에 효과적
- Reasoning model들이 수학/코딩과 달리 사회적 추론에서 다른 양상을 보이는 점은 중요한 발견
- ToM이 단순한 패턴 매칭이 아닌 확률적 추론 능력을 요구함을 시사