Introduction
- 대다수 ToM 벤치마크가 LLM이 새로운 partner에 적응하는지를 직접 테스트하지 못함
- 인간 ToM 테스트 방법에서 영감을 받아 AI에 인간과 유사한 특성을 귀속시키는 오류(fallacy) 발생
- LLM은 상황에 대한 다양한 질문에서 일관된 추론을 보이지 않음
- LLM Theory of Mind 기존 벤치마크 (ToMi, BigToM 등)
- LLM의 self-consistency 문제
- In-context adaptation 연구
Methods
- Literal Theory of Mind: 타인의 행동을 예측하는 능력 (기존 벤치마크가 측정)
- Functional Theory of Mind: in-context에서 agent에 적응하고 합리적으로 반응하는 능력 (새 개념)
- 강한 literal ToM이 강한 functional ToM을 의미하지 않음을 입증
- 매우 단순한 partner policy에서도 functional ToM 테스트
Results
- 많은 open-source LLM이 강한 literal ToM 능력을 보이나 functional ToM에서는 어려움
- Literal ToM 성능과 functional ToM 성능 간 양방향 모두 함의 관계 없음
- 특히 긴 상호작용에서 functional ToM 달성이 큰 도전
Discussion
- ToM 벤치마크 설계 시 functional 측면의 중요성 강조
- LLM의 self-consistent reasoning 부재가 근본적 문제
- 의미 있는 LLM ToM 평가에서 functional ToM의 중심적 역할 필요