본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
Home
❯
AI
❯
Papers
❯
Self Consciousness
❯
Self Knowledge
폴더: AI/Papers/Self-Consciousness/Self-Knowledge
8건의 항목
2026년 4월 13일
Brittle Minds Fixable Activations - Understanding Belief Representations in Language Models
2026년 4월 13일
Do Large Language Models Know What They Don't Know
2026년 4월 13일
Don't Just Say I don't know - Self-aligning LLMs for Responding to Unknown Questions
2026년 4월 13일
Language Models Are Capable of Metacognitive Monitoring and Control of Their Internal Activations
2026년 4월 13일
Large Language Models Must Be Taught to Know What They Don't Know
2026년 4월 13일
R-Tuning - Instructing Large Language Models to Say I Don't Know
2026년 4월 13일
Shared Parameter Subspaces and Cross-Task Linearity in Emergently Misaligned Behavior
2026년 4월 13일
Trustworthiness and Self-awareness in LLMs - Think-Solve-Verify