본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
Home
❯
AI
❯
Papers
❯
Self Consciousness
❯
bench
폴더: AI/Papers/Self-Consciousness/bench
14건의 항목
2026년 2월 11일
CogToM - A Comprehensive Theory of Mind Benchmark inspired by Human Cognition
2026년 2월 11일
DynToM - Towards Dynamic Theory of Mind
2026년 2월 11일
Evidence for Limited Metacognition in LLMs
2026년 2월 11일
FANToM - A Benchmark for Stress-testing Machine Theory of Mind in Interactions
2026년 2월 11일
HI-TOM - A Benchmark for Evaluating Higher-Order Theory of Mind Reasoning in Large Language Models
2026년 2월 11일
MM-SAP - A Comprehensive Benchmark for Assessing Self-Awareness of Multimodal Large Language Models in Perception
2026년 2월 11일
Metacognition and Uncertainty Communication in Humans and Large Language Models
2026년 2월 11일
NegotiationToM - A Benchmark for Stress-testing Machine Theory of Mind on Negotiation Surrounding
2026년 2월 11일
Re-evaluating Theory of Mind Evaluation in Large Language Models
2026년 2월 11일
Rethinking Theory of Mind Benchmarks for LLMs - Towards A User-Centered Perspective
2026년 2월 11일
SODA
2026년 2월 11일
SimpleToM - Exposing the Gap between Explicit ToM Inference and Implicit ToM Application in LLMs
2026년 2월 11일
What Large Language Models Know and What People Think They Know
2026년 2월 11일
_survey-overview