Introduction


  • 기존 LLM 추론 방법은 수학/코딩 등 ground-truth가 있는 과제에서는 뛰어나지만, 타인의 정신 상태 추적처럼 정답이 없는 시나리오에서는 어려움
  • Sequential Monte Carlo 알고리즘에서 영감을 받아, thought-tracing 추론 알고리즘 제안
  • Bayesian theory-of-mind framework를 기반으로, LLM이 확률적 추론을 근사하여 에이전트의 변화하는 정신 상태를 추적

Related Papers


  • 기존 LLM 추론: chain-of-thought, tree-of-thought 등 → ground-truth 기반 검증에 의존
  • Bayesian Theory of Mind (BToM) 프레임워크

Methods


  • Thought-Tracing: 특정 에이전트의 정신 상태를 추적하기 위한 inference-time 추론 알고리즘
  • 가설(hypothesis)을 생성하고, 관측(observation)에 기반하여 가중치를 부여
  • Ground-truth solution 없이 작동: 데이터셋의 정답에 의존하지 않음
  • LLM을 활용하여 에이전트의 인식(perception)과 행동(action)에 기반한 정신 상태의 확률적 추론을 근사

Results


  • 다양한 ToM 벤치마크에서 baseline LLM 대비 유의미한 성능 향상
  • o3, R1 등 최신 reasoning 모델의 ToM 과제에서의 흥미로운 행동 패턴 발견
  • 사회적 추론(social reasoning)이 다른 도메인과 근본적으로 다름을 보여줌

Discussion


  • Bayesian inference를 inference-time에 근사하는 접근이 ToM 추론에 효과적
  • Reasoning model들이 수학/코딩과 달리 사회적 추론에서 다른 양상을 보이는 점은 중요한 발견
  • ToM이 단순한 패턴 매칭이 아닌 확률적 추론 능력을 요구함을 시사