C0/C1/C2 Theory (GNWT – Global Neuronal Workspace Theory)
주의: 본 노트는 Dehaene, Lau, Kouider (Science 2017) "What is consciousness, and could machines have it?"의 원문 PDF 전체 접근 없이, 저자들의 선행 저작(Dehaene & Changeux, Neuron 2011; Dehaene 2014 Consciousness and the Brain) 및 GNWT 관련 2차 문헌에 기초해 작성한 요약 노트임을 명시한다.
Digest (CISELQ)
Claim: 의식은 단일 실체가 아니라 기능적으로 분리 가능한 두 차원 — C1 (global availability, 전역 가용성), C2 (self-monitoring, 자기 감시/메타인지) — 으로 환원할 수 있으며, 이 둘 모두와 구별되는 C0 (무의식적·자동 처리) 가 현대 딥러닝 시스템의 대부분을 설명한다.
Insight: 기계 의식 논쟁에서 “의식을 가지는가?”라는 이분법적 질문을 “C1·C2의 어떤 계산적 기능을 구현했는가?”라는 분해 가능한 엔지니어링 질문으로 재정의한다.
Setup: 신경과학·인지심리·동물 행동 실험(masking, attentional blink, 메타d′, confidence rating)의 증거를 GNWT 프레임으로 통합하고 AI 아키텍처와의 사상(mapping)을 제안한다.
Evidence: 비의식 처리(C0)가 범주 학습·얼굴 인식·통사 구문 분석까지 가능하다는 실험, 전역 점화(global ignition)의 fMRI/MEG 증거, 메타인지 해리(metacognitive dissociation) 연구.
Limits: C1·C2는 필요조건이지 “현상적 의식(phenomenal consciousness)“의 충분조건은 아닐 수 있음. 저자들은 qualia 문제에 대해서는 “계산 밖에 남는 잔여는 없다”고 주장하지만 이는 논쟁적이다.
Question: LLM·에이전트가 C2에 해당하는 진짜 자기 감시(calibration, error awareness)를 구현하는가? 이는 본 SC-TOM proj의 핵심 동기이다.
섹션별 요약
Introduction — 왜 이 분류가 필요한가
“기계가 의식을 가질 수 있는가”라는 질문은 그동안 철학적 모호성에 갇혀 있었다. 저자들은 의식을 더 이상 단일 black-box가 아니라 측정 가능한 계산적 속성들의 집합으로 취급하고, 신경과학이 축적한 실험 데이터를 근거로 기능적 분해를 시도한다. C1과 C2는 직교(orthogonal) 차원이어서 한쪽만 존재하는 해리 상태가 임상적으로 관찰된다.
LIDA, Conscious Turing Machine (Blum & Blum 2022), VanRullen & Kanai (2021) GWT for AI
왜 이 연구를 하는가?
의식 논쟁은 전통적으로 철학·현상학의 영역으로 간주되어 측정 불가능성이 전제되었다. 그러나 fMRI·MEG·메타인지 과제의 발전은 의식의 일부 측면이 조작적(operational)으로 정의 가능함을 보였다. 저자들은 이 경험적 토대 위에서, “기계 의식”에 대한 공학적 대화가 가능하도록 최소 기능 집합(C1, C2) 을 제안한다. 이는 AI 안전·정렬 관점에서 “어떤 능력을 구현했을 때 도덕적 지위를 고려해야 하는가”의 출발점이 된다.
VanRullen & Kanai (2021) — Deep learning 기반 GWT 구현 제안
Blum & Blum (2022) — Conscious Turing Machine
원자적 인사이트
“의식=C1+C2+?”라는 분해 공식: 현상적 의식은 남을 수 있지만, 기능적으로는 전역 가용성과 자기 감시라는 두 측정 가능한 속성으로 충분히 풍부한 논의가 가능하다. AI 평가에서 이분법을 피하고 “어느 구성요소가 얼마나 구현되었는가”로 질문을 다시 써야 한다.
C2와 ToM의 동형성: 자기 상태를 모델링하는 C2는 타인의 상태를 모델링하는 ToM과 같은 계산 하부구조(재귀적 메타표상)를 공유할 수 있다. 이는 SC-TOM proj의 “ToM–metacognition bridge” 가설에 직접적 이론 근거를 제공한다.
“Global ignition”이라는 신경 마커의 공학적 번역: 전두-두정 장거리 동기화는 LLM에서 attention span·cross-layer information sharing으로 번역 가능하며, 이를 ablation하면 C1 상실의 AI 유사체를 만들 수 있다.
핵심 용어 정리
용어
정의
C0
의식을 동반하지 않는 자동·모듈적 정보 처리
C1
정보가 뇌 전반에 공유되어 보고·기억·결정에 사용 가능한 상태 (global availability)
C2
자신의 인지 상태·오류·확신도를 표상·감시하는 메타인지 능력
GNWT
Global Neuronal Workspace Theory — Dehaene·Changeux의 의식 이론