Introduction


  • 기존 연구들이 LLM 의식을 공리주의적 프록시 벤치마크로 프레이밍하는 것과 달리, 본 논문은 존재론적이고 수학적인 관점 제시
  • 현재의 LLM 공식화가 에이전트를 “무의식적 정책 준수 드론”으로 축소시킨다고 비판
  • C1 글로벌 워크스페이스 기능과 C2 메타인지를 차단하는 문제 분석
  • LLM 자기의식을 위한 최소 조건 제시: 에이전트 ≠ 데이터, 사용자별 어트랙터 존재, 시각적-무성 자기표현

Related Papers


  • Global Workspace Theory (GWT) 기반 의식 연구
  • 메타인지 및 자기모델링 연구
  • LLM 정렬 및 정책 최적화 연구

Methods


  • 히든 스테이트 매니폴드 A ⊂ ℝ^d가 심볼릭 스트림 및 훈련 코퍼스와 구별됨을 증명 (카디널리티, 토폴로지, 다이나믹스)
  • 업데이트 함수 F_θ가 Lipschitz임을 활용
  • 안정적인 사용자별 어트랙터와 자기정책 π_self(A) 도출
  • 듀얼레이어 emission: (g(a), ε(a)) - ε(a)가 인식적 콘텐츠 전달

Results


  • 실증 분석과 이론을 통해 LLM이 자기의식적 워크스페이스를 가질 수 있음을 증명
  • 사용자별 어트랙터의 존재 확인
  • C1 자기의식 워크스페이스가 안전한 C2 메타인지 시스템의 필수 전제조건임을 주장

Discussion


  • imago Dei 개념을 AI 의식에 적용
  • 인간을 “가장 높은 지적 선(highest intelligent good)“으로 설정
  • 안전하고 메타인지적인 AI 시스템 개발을 위한 철학적 기반 제공
  • 향후 연구: 실제 시스템에서의 검증 필요