Introduction


  • 인간의 사회적 상호작용은 타인의 의도, 감정, 신념을 추론하는 능력(ToM)에 의존
  • LLM은 의미 이해 과제에서 뛰어나지만, 인간 소통에 내재한 모호성과 맥락적 뉘앙스에서는 어려움
  • 메타인지(metacognition)에 대한 심리학 이론에서 영감을 받은 멀티에이전트 프레임워크 MetaMind 제안

Related Papers


  • LLM의 ToM 능력 평가 연구들
  • 메타인지 및 사회 인지 심리학 이론

Methods


  • 3단계 협력적 사회적 이해 분해:
    1. Theory-of-Mind Agent: 사용자 정신 상태(의도, 감정)에 대한 가설 생성
    2. Moral Agent: 문화적 규범 및 윤리적 제약을 적용하여 가설 정제
    3. Response Agent: 추론된 의도와의 일치성을 검증하며 맥락에 적합한 응답 생성
  • 각 에이전트가 전문적 역할을 수행하여 사회적 추론의 복잡성을 분해

Results


  • 3개의 도전적 벤치마크에서 SOTA 달성
  • 실세계 사회적 시나리오에서 35.7% 향상, ToM 추론에서 6.2% 향상
  • 주요 ToM 과제에서 LLM이 최초로 인간 수준 성능 달성
  • Ablation study로 모든 구성 요소의 필요성 확인

Discussion


  • 메타인지 프레임워크가 LLM의 사회적 지능을 향상시키는 유효한 접근
  • 공감적 대화(empathetic dialogue) 및 문화적으로 민감한 상호작용에 응용 가능
  • 맥락적 타당성, 사회적 적절성, 사용자 적응 간의 균형을 달성