Introduction
- 인간의 사회적 상호작용은 타인의 의도, 감정, 신념을 추론하는 능력(ToM)에 의존
- LLM은 의미 이해 과제에서 뛰어나지만, 인간 소통에 내재한 모호성과 맥락적 뉘앙스에서는 어려움
- 메타인지(metacognition)에 대한 심리학 이론에서 영감을 받은 멀티에이전트 프레임워크 MetaMind 제안
- LLM의 ToM 능력 평가 연구들
- 메타인지 및 사회 인지 심리학 이론
Methods
- 3단계 협력적 사회적 이해 분해:
- Theory-of-Mind Agent: 사용자 정신 상태(의도, 감정)에 대한 가설 생성
- Moral Agent: 문화적 규범 및 윤리적 제약을 적용하여 가설 정제
- Response Agent: 추론된 의도와의 일치성을 검증하며 맥락에 적합한 응답 생성
- 각 에이전트가 전문적 역할을 수행하여 사회적 추론의 복잡성을 분해
Results
- 3개의 도전적 벤치마크에서 SOTA 달성
- 실세계 사회적 시나리오에서 35.7% 향상, ToM 추론에서 6.2% 향상
- 주요 ToM 과제에서 LLM이 최초로 인간 수준 성능 달성
- Ablation study로 모든 구성 요소의 필요성 확인
Discussion
- 메타인지 프레임워크가 LLM의 사회적 지능을 향상시키는 유효한 접근
- 공감적 대화(empathetic dialogue) 및 문화적으로 민감한 상호작용에 응용 가능
- 맥락적 타당성, 사회적 적절성, 사용자 적응 간의 균형을 달성