본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
Home
❯
AI
❯
Papers
❯
Theory of Mind
❯
_benchmarks
폴더: AI/Papers/Theory-of-Mind/_benchmarks
6건의 항목
2026년 4월 13일
Explore Theory-of-Mind - Program-Guided Adversarial Data Generation for Theory of Mind Reasoning
2026년 4월 13일
FANToM - A Benchmark for Stress-testing Machine Theory of Mind in Interactions
2026년 4월 13일
MoToMQA - LLMs Achieve Adult Human Performance on Higher-Order Theory of Mind Tasks
2026년 4월 13일
OpenToM - A Comprehensive Benchmark for Evaluating Theory-of-Mind Reasoning
2026년 4월 13일
TOM BENCH - Benchmarking Theory of Mind in Large Language Models
2026년 4월 13일
ToMATO - Verbalizing the Mental States of Role-Playing LLMs for Benchmarking Theory of Mind