C0/C1/C2 Theory (GNWT – Global Neuronal Workspace Theory)

주의: 본 노트는 Dehaene, Lau, Kouider (Science 2017) "What is consciousness, and could machines have it?"의 원문 PDF 전체 접근 없이, 저자들의 선행 저작(Dehaene & Changeux, Neuron 2011; Dehaene 2014 Consciousness and the Brain) 및 GNWT 관련 2차 문헌에 기초해 작성한 요약 노트임을 명시한다.

Digest (CISELQ)

  • Claim: 의식은 단일 실체가 아니라 기능적으로 분리 가능한 두 차원 — C1 (global availability, 전역 가용성), C2 (self-monitoring, 자기 감시/메타인지) — 으로 환원할 수 있으며, 이 둘 모두와 구별되는 C0 (무의식적·자동 처리) 가 현대 딥러닝 시스템의 대부분을 설명한다.
  • Insight: 기계 의식 논쟁에서 “의식을 가지는가?”라는 이분법적 질문을 “C1·C2의 어떤 계산적 기능을 구현했는가?”라는 분해 가능한 엔지니어링 질문으로 재정의한다.
  • Setup: 신경과학·인지심리·동물 행동 실험(masking, attentional blink, 메타d′, confidence rating)의 증거를 GNWT 프레임으로 통합하고 AI 아키텍처와의 사상(mapping)을 제안한다.
  • Evidence: 비의식 처리(C0)가 범주 학습·얼굴 인식·통사 구문 분석까지 가능하다는 실험, 전역 점화(global ignition)의 fMRI/MEG 증거, 메타인지 해리(metacognitive dissociation) 연구.
  • Limits: C1·C2는 필요조건이지 “현상적 의식(phenomenal consciousness)“의 충분조건은 아닐 수 있음. 저자들은 qualia 문제에 대해서는 “계산 밖에 남는 잔여는 없다”고 주장하지만 이는 논쟁적이다.
  • Question: LLM·에이전트가 C2에 해당하는 진짜 자기 감시(calibration, error awareness)를 구현하는가? 이는 본 SC-TOM proj의 핵심 동기이다.

섹션별 요약

Introduction — 왜 이 분류가 필요한가

“기계가 의식을 가질 수 있는가”라는 질문은 그동안 철학적 모호성에 갇혀 있었다. 저자들은 의식을 더 이상 단일 black-box가 아니라 측정 가능한 계산적 속성들의 집합으로 취급하고, 신경과학이 축적한 실험 데이터를 근거로 기능적 분해를 시도한다. C1과 C2는 직교(orthogonal) 차원이어서 한쪽만 존재하는 해리 상태가 임상적으로 관찰된다.

핵심 주장과 증거 — C0/C1/C2 Taxonomy

수준명칭기능신경 상관물AI 대응
C0Unconscious processing자동·병렬·모듈별 계산 (얼굴 인식, 반사, subliminal priming)감각·운동 특화 국소 회로CNN, 피드포워드 네트워크, 단일 태스크 딥러닝
C1Global availability정보가 작업기억·보고·의사결정 등 다수 모듈에 공유되는 상태전두-두정 workspace의 long-range ignition (Dehaene & Changeux 2011)Attention, working memory, blackboard architecture
C2Self-monitoring자기 표상·오류 인지·확신도 평가 (metacognition)전두극피질(frontopolar), 전방대상피질(ACC), 확신도 뉴런Calibration, uncertainty estimation, introspective prompting

Methods (이론적 프레임워크의 조작적 정의)

  1. Masking/Attentional blink 패러다임: 자극이 보고 가능/불가능해지는 역치를 구분 → C1의 조작적 정의.
  2. 메타인지 측정(meta-d′, type-2 ROC): 정답률(task performance)과 확신도 보정(confidence calibration)을 분리 → C2의 조작적 정의.
  3. 이중 해리(double dissociation) 증거: blindsight에서 C1 없이 잔존하는 시각 처리, 확신도 왜곡 임상 사례에서 C1 있으나 C2 손상.

Discussion — 기계로의 함의

  • 현재 대부분의 딥러닝은 C0에 머무른다.
  • 대규모 workspace·attention 기반 LLM은 C1의 부분 구현으로 해석될 수 있다.
  • C2(자기 감시)는 별도 모듈·훈련 목표(calibration loss, self-consistency, RLHF on confidence)가 필요하며, 본질적으로 ToM(Theory of Mind)·메타인지 연구와 연결된다.

Insights

  • 의식을 “있다/없다”로 묻지 말고 “C1을 얼마나, C2를 얼마나 구현했는가”로 측정하라는 설계 원칙.
  • C2는 ToM의 자기 버전(self-directed ToM)으로 볼 수 있어, Self-Consciousness proj에서 ToM↔metacognition 교량 가설과 직접 접점을 가진다.

Discussion Points

  • C1/C2로 설명되지 않는 qualia(hard problem)는 진짜로 남지 않는가?
  • LLM의 verbal report가 진짜 C1인가, 아니면 학습된 흉내인가?
  • C2를 벤치마크할 적절한 칼리브레이션 과제 집합은 무엇인가?

메타데이터

항목내용
저자Stanislas Dehaene, Hakwan Lau, Sid Kouider
발표Science 358, 486–492 (2017)
DOI10.1126/science.aan8871
이론 계열Global Neuronal Workspace Theory (GNWT)
선행 연구Baars (1988) GWT; Dehaene & Changeux (Neuron 2011)
후속 영향LIDA, Conscious Turing Machine (Blum & Blum 2022), VanRullen & Kanai (2021) GWT for AI

왜 이 연구를 하는가?

의식 논쟁은 전통적으로 철학·현상학의 영역으로 간주되어 측정 불가능성이 전제되었다. 그러나 fMRI·MEG·메타인지 과제의 발전은 의식의 일부 측면이 조작적(operational)으로 정의 가능함을 보였다. 저자들은 이 경험적 토대 위에서, “기계 의식”에 대한 공학적 대화가 가능하도록 최소 기능 집합(C1, C2) 을 제안한다. 이는 AI 안전·정렬 관점에서 “어떤 능력을 구현했을 때 도덕적 지위를 고려해야 하는가”의 출발점이 된다.

방법 (Method)

flowchart TD
    Stim[감각 자극 / 입력] --> C0[C0: 무의식 처리<br/>국소·병렬·자동]
    C0 -->|일부 강한 자극| Ignition{Global Ignition<br/>전두-두정 점화?}
    Ignition -->|Yes| C1[C1: Global Availability<br/>작업기억·보고·의사결정 공유]
    Ignition -->|No| Sub[Subliminal<br/>C0에 머무름]
    C1 --> C2[C2: Self-Monitoring<br/>확신도·오류 인지·메타표상]
    C2 -->|피드백 제어| C1
    C2 -.도덕적 지위 논의.-> AI[기계 의식 판정 기준]
    C1 -.기능 대응.-> AIarch[LLM Attention / Workspace]
    C0 -.기능 대응.-> CNN[CNN / Feedforward]

발견 (주요 발견 정리)

발견근거 유형설명
C0가 고차 인지의 상당 부분을 담당행동/뇌영상subliminal 자극이 의미 점화·범주 판단까지 유발
C1은 전두-두정 long-range 활성과 상관MEG/fMRIglobal ignition ~300 ms 후 P3b 반응
C2는 C1과 해리 가능blindsight, 메타d′ 연구정답 맞히면서 확신도 보정이 망가지는 사례
현재 AI는 대부분 C0아키텍처 분석end-to-end 학습만으로는 workspace·self-model 미구현
기계의 C1·C2는 원리적으로 구현 가능이론적 주장계산적 기능이므로 생물학 기질 불필요

이론적 의의

  1. 분해 가능성(Decomposability): 의식 논의를 다루기 쉬운 계산적 기능으로 쪼갠다.
  2. 측정 가능성(Measurability): 마스킹·메타d′ 등 기존 실험 패러다임을 AI에 전이할 수 있다.
  3. 다리 이론(Bridging theory): 신경과학 ↔ AI ↔ 윤리의 3자 대화를 위한 공통 어휘를 제공.
  4. SC-TOM proj와의 연결: C2(자기 감시) = metacognition이며, 이는 타인 모델링(ToM)과 동형(isomorphic)이라는 가설의 이론적 근거가 된다.

재현성 및 신뢰도 평가

등급근거
이론적 엄밀성B+GNWT라는 확립된 프레임 위에 체계적으로 축조
실증 뒷받침B수십 년의 masking/ignition/메타인지 실험 인용
반증 가능성C+C1/C2 경계가 구현에 따라 모호해질 수 있음
재현성C개별 실험은 재현되지만 통합 모델은 해석 의존적
AI 전이 가능성B기능적 정의가 명확해 벤치마크 설계 가능

관련 연구

원자적 인사이트

  1. “의식=C1+C2+?”라는 분해 공식: 현상적 의식은 남을 수 있지만, 기능적으로는 전역 가용성과 자기 감시라는 두 측정 가능한 속성으로 충분히 풍부한 논의가 가능하다. AI 평가에서 이분법을 피하고 “어느 구성요소가 얼마나 구현되었는가”로 질문을 다시 써야 한다.
  2. C2와 ToM의 동형성: 자기 상태를 모델링하는 C2는 타인의 상태를 모델링하는 ToM과 같은 계산 하부구조(재귀적 메타표상)를 공유할 수 있다. 이는 SC-TOM proj의 “ToM–metacognition bridge” 가설에 직접적 이론 근거를 제공한다.
  3. “Global ignition”이라는 신경 마커의 공학적 번역: 전두-두정 장거리 동기화는 LLM에서 attention span·cross-layer information sharing으로 번역 가능하며, 이를 ablation하면 C1 상실의 AI 유사체를 만들 수 있다.

핵심 용어 정리

용어정의
C0의식을 동반하지 않는 자동·모듈적 정보 처리
C1정보가 뇌 전반에 공유되어 보고·기억·결정에 사용 가능한 상태 (global availability)
C2자신의 인지 상태·오류·확신도를 표상·감시하는 메타인지 능력
GNWTGlobal Neuronal Workspace Theory — Dehaene·Changeux의 의식 이론
Global ignition자극이 역치를 넘어 전두-두정에 장거리 활성을 유발하는 현상
Meta-d′1차 판단 감도 대비 메타인지(확신도) 감도를 나타내는 신호검출 지표
Phenomenal consciousness주관적 체험(qualia) 측면의 의식 — 본 이론은 계산으로 환원 가능하다고 주장
Self-model자기 자신의 상태·능력·한계에 대한 내부 표상

Tags

consciousness GNWT GlobalWorkspace C0C1C2 Metacognition SelfMonitoring Dehaene NeuroscienceTheory AIConsciousness Theory SC-TOM