C0/C1/C2 Theory (GNWT – Global Neuronal Workspace Theory)

주의: 본 노트는 Dehaene, Lau, Kouider (Science 2017) "What is consciousness, and could machines have it?"의 원문 PDF 전체 접근 없이, 저자들의 선행 저작(Dehaene & Changeux, Neuron 2011; Dehaene 2014 Consciousness and the Brain) 및 GNWT 관련 2차 문헌에 기초해 작성한 요약 노트임을 명시한다.

Digest (CISELQ)

Claim: 의식은 단일 실체가 아니라 기능적으로 분리 가능한 두 차원 — C1 (global availability, 전역 가용성), C2 (self-monitoring, 자기 감시/메타인지) — 으로 환원할 수 있으며, 이 둘 모두와 구별되는 C0 (무의식적·자동 처리) 가 현대 딥러닝 시스템의 대부분을 설명한다.
Insight: 기계 의식 논쟁에서 “의식을 가지는가?”라는 이분법적 질문을 “C1·C2의 어떤 계산적 기능을 구현했는가?”라는 분해 가능한 엔지니어링 질문으로 재정의한다.
Setup: 신경과학·인지심리·동물 행동 실험(masking, attentional blink, 메타d′, confidence rating)의 증거를 GNWT 프레임으로 통합하고 AI 아키텍처와의 사상(mapping)을 제안한다.
Evidence: 비의식 처리(C0)가 범주 학습·얼굴 인식·통사 구문 분석까지 가능하다는 실험, 전역 점화(global ignition)의 fMRI/MEG 증거, 메타인지 해리(metacognitive dissociation) 연구.
Limits: C1·C2는 필요조건이지 “현상적 의식(phenomenal consciousness)“의 충분조건은 아닐 수 있음. 저자들은 qualia 문제에 대해서는 “계산 밖에 남는 잔여는 없다”고 주장하지만 이는 논쟁적이다.
Question: LLM·에이전트가 C2에 해당하는 진짜 자기 감시(calibration, error awareness)를 구현하는가? 이는 본 SC-TOM proj의 핵심 동기이다.

섹션별 요약

Introduction — 왜 이 분류가 필요한가

“기계가 의식을 가질 수 있는가”라는 질문은 그동안 철학적 모호성에 갇혀 있었다. 저자들은 의식을 더 이상 단일 black-box가 아니라 측정 가능한 계산적 속성들의 집합으로 취급하고, 신경과학이 축적한 실험 데이터를 근거로 기능적 분해를 시도한다. C1과 C2는 직교(orthogonal) 차원이어서 한쪽만 존재하는 해리 상태가 임상적으로 관찰된다.

핵심 주장과 증거 — C0/C1/C2 Taxonomy

수준	명칭	기능	신경 상관물	AI 대응
C0	Unconscious processing	자동·병렬·모듈별 계산 (얼굴 인식, 반사, subliminal priming)	감각·운동 특화 국소 회로	CNN, 피드포워드 네트워크, 단일 태스크 딥러닝
C1	Global availability	정보가 작업기억·보고·의사결정 등 다수 모듈에 공유되는 상태	전두-두정 workspace의 long-range ignition (Dehaene & Changeux 2011)	Attention, working memory, blackboard architecture
C2	Self-monitoring	자기 표상·오류 인지·확신도 평가 (metacognition)	전두극피질(frontopolar), 전방대상피질(ACC), 확신도 뉴런	Calibration, uncertainty estimation, introspective prompting

Methods (이론적 프레임워크의 조작적 정의)

Masking/Attentional blink 패러다임: 자극이 보고 가능/불가능해지는 역치를 구분 → C1의 조작적 정의.
메타인지 측정(meta-d′, type-2 ROC): 정답률(task performance)과 확신도 보정(confidence calibration)을 분리 → C2의 조작적 정의.
이중 해리(double dissociation) 증거: blindsight에서 C1 없이 잔존하는 시각 처리, 확신도 왜곡 임상 사례에서 C1 있으나 C2 손상.

Discussion — 기계로의 함의

현재 대부분의 딥러닝은 C0에 머무른다.
대규모 workspace·attention 기반 LLM은 C1의 부분 구현으로 해석될 수 있다.
C2(자기 감시)는 별도 모듈·훈련 목표(calibration loss, self-consistency, RLHF on confidence)가 필요하며, 본질적으로 ToM(Theory of Mind)·메타인지 연구와 연결된다.

Insights

의식을 “있다/없다”로 묻지 말고 “C1을 얼마나, C2를 얼마나 구현했는가”로 측정하라는 설계 원칙.
C2는 ToM의 자기 버전(self-directed ToM)으로 볼 수 있어, Self-Consciousness proj에서 ToM↔metacognition 교량 가설과 직접 접점을 가진다.

Discussion Points

C1/C2로 설명되지 않는 qualia(hard problem)는 진짜로 남지 않는가?
LLM의 verbal report가 진짜 C1인가, 아니면 학습된 흉내인가?
C2를 벤치마크할 적절한 칼리브레이션 과제 집합은 무엇인가?

메타데이터

항목	내용
저자	Stanislas Dehaene, Hakwan Lau, Sid Kouider
발표	Science 358, 486–492 (2017)
DOI	10.1126/science.aan8871
이론 계열	Global Neuronal Workspace Theory (GNWT)
선행 연구	Baars (1988) GWT; Dehaene & Changeux (Neuron 2011)
후속 영향	LIDA, Conscious Turing Machine (Blum & Blum 2022), VanRullen & Kanai (2021) GWT for AI

왜 이 연구를 하는가?

의식 논쟁은 전통적으로 철학·현상학의 영역으로 간주되어 측정 불가능성이 전제되었다. 그러나 fMRI·MEG·메타인지 과제의 발전은 의식의 일부 측면이 조작적(operational)으로 정의 가능함을 보였다. 저자들은 이 경험적 토대 위에서, “기계 의식”에 대한 공학적 대화가 가능하도록 최소 기능 집합(C1, C2) 을 제안한다. 이는 AI 안전·정렬 관점에서 “어떤 능력을 구현했을 때 도덕적 지위를 고려해야 하는가”의 출발점이 된다.

방법 (Method)

flowchart TD
    Stim[감각 자극 / 입력] --> C0[C0: 무의식 처리<br/>국소·병렬·자동]
    C0 -->|일부 강한 자극| Ignition{Global Ignition<br/>전두-두정 점화?}
    Ignition -->|Yes| C1[C1: Global Availability<br/>작업기억·보고·의사결정 공유]
    Ignition -->|No| Sub[Subliminal<br/>C0에 머무름]
    C1 --> C2[C2: Self-Monitoring<br/>확신도·오류 인지·메타표상]
    C2 -->|피드백 제어| C1
    C2 -.도덕적 지위 논의.-> AI[기계 의식 판정 기준]
    C1 -.기능 대응.-> AIarch[LLM Attention / Workspace]
    C0 -.기능 대응.-> CNN[CNN / Feedforward]

발견 (주요 발견 정리)

발견	근거 유형	설명
C0가 고차 인지의 상당 부분을 담당	행동/뇌영상	subliminal 자극이 의미 점화·범주 판단까지 유발
C1은 전두-두정 long-range 활성과 상관	MEG/fMRI	global ignition ~300 ms 후 P3b 반응
C2는 C1과 해리 가능	blindsight, 메타d′ 연구	정답 맞히면서 확신도 보정이 망가지는 사례
현재 AI는 대부분 C0	아키텍처 분석	end-to-end 학습만으로는 workspace·self-model 미구현
기계의 C1·C2는 원리적으로 구현 가능	이론적 주장	계산적 기능이므로 생물학 기질 불필요

이론적 의의

분해 가능성(Decomposability): 의식 논의를 다루기 쉬운 계산적 기능으로 쪼갠다.
측정 가능성(Measurability): 마스킹·메타d′ 등 기존 실험 패러다임을 AI에 전이할 수 있다.
다리 이론(Bridging theory): 신경과학 ↔ AI ↔ 윤리의 3자 대화를 위한 공통 어휘를 제공.
SC-TOM proj와의 연결: C2(자기 감시) = metacognition이며, 이는 타인 모델링(ToM)과 동형(isomorphic)이라는 가설의 이론적 근거가 된다.

재현성 및 신뢰도 평가

축	등급	근거
이론적 엄밀성	B+	GNWT라는 확립된 프레임 위에 체계적으로 축조
실증 뒷받침	B	수십 년의 masking/ignition/메타인지 실험 인용
반증 가능성	C+	C1/C2 경계가 구현에 따라 모호해질 수 있음
재현성	C	개별 실험은 재현되지만 통합 모델은 해석 의존적
AI 전이 가능성	B	기능적 정의가 명확해 벤치마크 설계 가능

원자적 인사이트

“의식=C1+C2+?”라는 분해 공식: 현상적 의식은 남을 수 있지만, 기능적으로는 전역 가용성과 자기 감시라는 두 측정 가능한 속성으로 충분히 풍부한 논의가 가능하다. AI 평가에서 이분법을 피하고 “어느 구성요소가 얼마나 구현되었는가”로 질문을 다시 써야 한다.
C2와 ToM의 동형성: 자기 상태를 모델링하는 C2는 타인의 상태를 모델링하는 ToM과 같은 계산 하부구조(재귀적 메타표상)를 공유할 수 있다. 이는 SC-TOM proj의 “ToM–metacognition bridge” 가설에 직접적 이론 근거를 제공한다.
“Global ignition”이라는 신경 마커의 공학적 번역: 전두-두정 장거리 동기화는 LLM에서 attention span·cross-layer information sharing으로 번역 가능하며, 이를 ablation하면 C1 상실의 AI 유사체를 만들 수 있다.

핵심 용어 정리

용어	정의
C0	의식을 동반하지 않는 자동·모듈적 정보 처리
C1	정보가 뇌 전반에 공유되어 보고·기억·결정에 사용 가능한 상태 (global availability)
C2	자신의 인지 상태·오류·확신도를 표상·감시하는 메타인지 능력
GNWT	Global Neuronal Workspace Theory — Dehaene·Changeux의 의식 이론
Global ignition	자극이 역치를 넘어 전두-두정에 장거리 활성을 유발하는 현상
Meta-d′	1차 판단 감도 대비 메타인지(확신도) 감도를 나타내는 신호검출 지표
Phenomenal consciousness	주관적 체험(qualia) 측면의 의식 — 본 이론은 계산으로 환원 가능하다고 주장
Self-model	자기 자신의 상태·능력·한계에 대한 내부 표상

Juhyeon's Blog

탐색기

C0-C1-C2 Theory(GNWT - Global Neuronal Workspace Theory)

C0/C1/C2 Theory (GNWT – Global Neuronal Workspace Theory)

Digest (CISELQ)

섹션별 요약

Introduction — 왜 이 분류가 필요한가

핵심 주장과 증거 — C0/C1/C2 Taxonomy

Methods (이론적 프레임워크의 조작적 정의)

Discussion — 기계로의 함의

Insights

Discussion Points

메타데이터

왜 이 연구를 하는가?

방법 (Method)

발견 (주요 발견 정리)

이론적 의의

재현성 및 신뢰도 평가

관련 연구

원자적 인사이트

핵심 용어 정리

Tags

그래프 뷰

목차

Properties

백링크