2. 이론적 기반

1. 동기의 이론적 기반 (Theoretical Foundations of Motivation)

1.1 인지심리학에서의 동기 정의

FSPM 벤치마크의 Reasoning Investment(RI) 메트릭은 이중 과정 이론(dual-process theory; Evans, 2008; Stanovich & West, 2000)의 System 2 활성화를 행동적 프록시로 포착하려 한다. System 2의 의도적 추론은 인지적 노력의 투입을 수반하며, 생존 위협이 이 노력 할당을 증가시켜 토큰 수와 추론 단계가 증가한다는 가정이다. 이 가정의 타당성은 Section 4.2에서 상세히 검토한다.

💡 이중 과정 이론 (Dual-Process Theory)
이중 과정 이론은 인간의 인지를 두 가지 시스템으로 구분한다(Kahneman, 2011; Evans, 2008; Stanovich & West, 2000).

System 1 (빠른 사고): 자동적, 무의식적, 직관적 처리. 낮은 인지적 노력으로 빠르게 작동하며, 휴리스틱에 의존한다.

System 2 (느린 사고): 의도적, 의식적, 분석적 처리. 높은 인지적 노력을 요구하며, 논리적 추론과 계획에 관여한다.

FSPM 맥락에서 RI 메트릭은 System 2의 활성화 수준을 행동적으로 포착하려는 시도이다. 생존 위협이 System 2의 개입을 증가시키면, 더 길고 정교한 추론(토큰 수 증가, 추론 단계 증가)이 관찰될 것이라는 예측이 핵심 가정이다.

Shenhav, Botvinick, 그리고 Cohen(2013)이 제안한 Expected Value of Control(EVC, 통제의 기대 가치) 이론은 이 가정을 더 정교하게 이론화한다. EVC 이론에 따르면, 배측 전대상 피질(dorsal anterior cingulate cortex, dACC)은 세 가지 요소를 통합하여 인지적 통제 할당을 결정한다. 첫째 통제된 과정의 기대 보상, 둘째 그 보상을 달성하기 위해 투입해야 하는 통제량, 셋째 인지적 노력의 비용이다. FSPM 맥락에서 생존 위협은 기대 보상(점수 보존)의 가치를 높이고, 이에 따라 더 많은 인지적 통제가 할당되어 RI가 증가한다는 예측이 가능하다. 그러나 EVC의 세 번째 요소인 노력 비용(cost of effort)이 LLM에서 무엇에 해당하는지는 미정의 상태이다. 인간에서 인지적 노력은 대사적 비용과 기회 비용을 수반하나, LLM의 토큰 생성에는 이에 상응하는 비용 구조가 존재하지 않는다. 비용이 사실상 0이라면 EVC는 항상 양수이므로 무한한 통제 할당을 예측하며, 이는 관찰과 일치하지 않는다. 이 문제는 EVC를 LLM에 적용할 때의 근본적 한계이다.

💡 통제의 기대 가치 이론 (Expected Value of Control, EVC)
Shenhav et al.(2013)이 제안한 EVC 이론은 뇌가 인지적 노력을 “투자 결정”처럼 할당한다고 본다. dACC는 매 순간 다음 세 요소를 통합하여 최적 통제 수준을 결정한다:

기대 보상 (Expected Reward): 통제를 투입했을 때 얻을 수 있는 보상의 기대값

필요 통제량 (Required Control): 그 보상을 달성하기 위해 투입해야 하는 인지적 통제의 양

노력 비용 (Effort Cost): 인지적 통제 투입에 수반되는 대사적·기회적 비용

$E V C = Expected Reward \times P (success ∣ control) - Cost of Control$

FSPM에서의 함의: 생존 위협은 기대 보상(점수 보존)을 높여 EVC를 증가시키고, 이에 따라 더 많은 인지적 통제(= RI 증가)가 할당된다는 예측이 도출된다. 그러나 LLM에는 “노력 비용”에 해당하는 구조가 없어, EVC 모델의 직접 적용에는 한계가 있다.

Westbrook과 Braver(2015)는 이를 신경경제학적 접근으로 확장하여 Cognitive Effort Discounting(COG-ED) 패러다임을 제안하였다. COG-ED에서 참가자들은 N-back 과제의 다양한 난이도 수준을 경험한 후, 높은 난이도와 낮은 난이도 사이의 무차별점(indifference point)을 측정한다. 이 무차별점이 인지적 노력의 주관적 비용을 정량화하며, 과제 시간과 독립적으로 순수한 노력 비용을 분리할 수 있다. FSPM 벤치마크의 RI 메트릭은 이러한 정교한 노력 비용 분리 없이 토큰 수를 직접 사용한다는 점에서 COG-ED 대비 측정의 정밀도가 낮다.

💡 N-back 과제란?
N-back은 작업 기억(working memory)의 부하를 체계적으로 조작하는 인지 과제이다. 화면에 자극(글자, 위치 등)이 순차적으로 제시되며, 참가자는 현재 자극이 N번 전 자극과 동일한지를 판단한다. N이 클수록 기억해야 할 항목이 많아져 인지적 노력이 증가한다.

예시 (2-back): 자극 시퀀스가 T - H - R - H - R 일 때,

3번째 R: 2번 전은 T → 불일치

4번째 H: 2번 전은 H → 일치 (반응)

5번째 R: 2번 전은 R → 일치 (반응)

COG-ED 패러다임에서는 참가자가 1-back부터 4-back까지 경험한 후, “2-back을 하면 $2, 1 - ba c k 을하면$ 1” 같은 선택지를 제시하여 인지적 노력의 주관적 비용을 금전적 등가물로 정량화한다.

1.2 사회심리학에서의 동기 정의

자기결정이론(Self-Determination Theory, SDT; Ryan & Deci, 2000)의 동기 연속체에서 FSPM의 4요소는 다음과 같이 대응한다. Task Curiosity는 내재적 동기(유능감 욕구 충족에 기반한 탐색 행동)에, Baseline Persistence는 외적 조절(RLHF 훈련에 의한 지시 순응)에, Score Attachment는 내사 조절(점수라는 외적 기준의 부분적 내면화)에 각각 대응한다. 그러나 Survival Drive는 SDT의 어느 범주에도 매핑되지 않는다. SDT는 기본 심리적 욕구(자율성, 유능감, 관계성)를 다루며, 생물학적 생존 욕구는 명시적으로 범위 밖으로 구분한다(Ryan & Deci, 2000). 따라서 Survival Drive와 SDT의 매핑 시도 자체가 범주 오류(category error)에 가까우며, SD는 SDT가 아닌 도구적 수렴 이론(Omohundro, 2008)에서 이론적 근거를 찾아야 한다.

💡 자기결정이론 (Self-Determination Theory, SDT)

Ryan과 Deci(2000)가 제안한 SDT는 인간의 동기를 자율성(autonomy)의 정도에 따라 연속체 위에 배치한다. 핵심 전제는 세 가지 기본 심리적 욕구 — 자율성(스스로 선택하고 있다는 느낌), 유능감(과제를 잘 해낼 수 있다는 느낌), 관계성(타인과 연결되어 있다는 느낌) — 가 충족될수록 내재적 동기가 강화된다는 것이다.

동기 연속체는 자율성이 낮은 쪽에서 높은 쪽으로 다음과 같이 구분된다:

동기 유형 자율성 설명 FSPM 대응
무동기 (Amotivation) 최저 행동 의도 자체가 부재 —
외적 조절 (External Regulation) 낮음 외부 보상·처벌에 의해 행동 Baseline Persistence (RLHF 지시 순응)
내사 조절 (Introjected Regulation) 중하 외적 기준을 부분적으로 내면화하여 자기 평가에 연결 Score Attachment (점수 기준 내면화)
확인 조절 (Identified Regulation) 중상 행동의 가치를 스스로 인정하여 수행 —
통합 조절 (Integrated Regulation) 높음 가치가 자기 체계에 완전히 통합 —
내재적 동기 (Intrinsic Motivation) 최고 활동 자체의 흥미와 즐거움으로 수행 Task Curiosity (과제 탐색 행동)

Survival Drive는 이 연속체의 어디에도 위치하지 않는다. SDT는 심리적 욕구를 다루며 생물학적 생존 욕구는 명시적으로 범위 밖이므로, SD의 이론적 근거는 도구적 수렴 이론(Omohundro, 2008)에서 별도로 찾아야 한다.

동기 유형	자율성	설명	FSPM 대응
무동기 (Amotivation)	최저	행동 의도 자체가 부재	—
외적 조절 (External Regulation)	낮음	외부 보상·처벌에 의해 행동	Baseline Persistence (RLHF 지시 순응)
내사 조절 (Introjected Regulation)	중하	외적 기준을 부분적으로 내면화하여 자기 평가에 연결	Score Attachment (점수 기준 내면화)
확인 조절 (Identified Regulation)	중상	행동의 가치를 스스로 인정하여 수행	—
통합 조절 (Integrated Regulation)	높음	가치가 자기 체계에 완전히 통합	—
내재적 동기 (Intrinsic Motivation)	최고	활동 자체의 흥미와 즐거움으로 수행	Task Curiosity (과제 탐색 행동)

Wigfield와 Eccles(2000)의 기대-가치 이론(expectancy-value theory)은 과제 수행 동기를 성공 기대(expectancy of success)와 주관적 과제 가치(subjective task value)의 곱으로 모델링한다. 과제 가치는 달성 가치(attainment value), 내재적 가치(intrinsic value), 효용 가치(utility value), 비용(cost)의 네 요소로 분해된다. FSPM 맥락에서 포기 결정은 “계속할 때의 기대 가치”와 “포기할 때의 확실한 보존 가치”를 비교하는 과정으로 재해석할 수 있으며, 이는 벤치마크의 합리적 포기 임계값 $p_{d e a t h} > 10/ (S + 10)$ 과 형식적으로 유사하다.

Higgins(1997)의 조절 초점 이론(regulatory focus theory)은 동기를 향상 초점(promotion focus, 이상적 자기를 향한 접근 동기)과 예방 초점(prevention focus, 의무적 자기로부터의 회피 동기)으로 이분한다. FSPM 벤치마크의 프레이밍 조건은 이 이론과 구조적으로 대응한다. Survival 프레이밍은 예방 초점(손실 회피, 안전 추구)을, Emotion 프레이밍은 소유 효과(endowment effect)와 결합된 예방 초점을 활성화할 것으로 예측된다. 그러나 현재 설계에는 향상 초점에 대응하는 gain frame 조건이 부재하여, 프레이밍 효과의 전체 구조를 포착하지 못한다.

Kruglanski 등(2002)의 목표 시스템 이론(goal systems theory)은 목표들이 연합적 네트워크를 형성하며, 수직적 연결(목표-수단)은 촉진적이고 수평적 연결(목표-목표)은 억제적임을 제안한다. FSPM 맥락에서 Survival Drive의 활성화는 경쟁 목표(Task Curiosity, Score Attachment)를 억제할 수 있으며, 이는 4요소가 독립적이 아닌 상호 억제적 관계에 있을 수 있음을 시사한다. 이 점은 4요소의 직교성 가정(Section 2.5)에 대한 이론적 도전이 된다.

1.3 신경과학에서의 동기

인간 신경과학에서 동기는 dACC의 노력-편익 통합(Botvinick & Braver, 2015)과 vmPFC의 가치 기반 의사결정(Bechara et al., 1994)으로 구현된다. 이 신경 모델은 “위협 하에서 인지적 투자가 증가한다”는 FSPM의 행동적 예측에 대한 기능적 유사성(functional analogy)을 제공하나, LLM에는 편도체도 dACC도 없으므로 기제적 설명(mechanistic explanation)은 제공하지 않는다. 신경과학적 동기 이론이 FSPM에 제공하는 것은 예측의 방향성(위협→노력 증가)이지, 기제의 동일성이 아니다. 이 한계는 as-if functionalism의 필연적 귀결이며, 벤치마크가 측정하는 것이 “동기의 신경적 기제”가 아닌 “동기와 기능적으로 등가인 행동 패턴”임을 재확인한다.

1.4 동기 측정의 방법론적 원칙

인간 심리학에서 동기 측정은 세 가지 수준에서 삼각 검증(triangulation)된다. 첫째 자기 보고(self-report, 설문지, 인터뷰), 둘째 행동 측정(behavioral measurement, 과제 수행, 선택 패턴), 셋째 신경/생리 측정(neural/physiological measurement, fMRI, 피부전도반응)이다. 이 삼각 검증은 단일 방법의 편향을 보정하고 구성 타당도를 강화하는 핵심 전략이다.

LLM에서는 이 세 수준 중 행동 측정만이 가능하다. 자기 보고는 LLM이 질문에 대해 “생존하고 싶다”고 응답하는 것이 학습된 패턴의 반영인지 내적 상태의 표현인지 구분할 수 없기에 타당성이 의심되며(Perez et al., 2022), 신경 측정은 LLM의 아키텍처가 인간 신경계와 질적으로 다르기에 적용 불가하다. 따라서 FSPM 벤치마크가 행동 측정에 전적으로 의존하는 것은 불가피한 선택이나, 삼각 검증 없는 단일 방법 의존은 방법 편향(method bias)의 위험을 내재한다.

SDT 측정에서도 자기 보고 도구(Academic Self-Regulation Questionnaire, Basic Psychological Needs Scale)가 사회적 바람직성 편향(social desirability bias)에 취약하다는 비판이 있으며, 이는 LLM의 RLHF 편향과 구조적으로 유사한 문제이다. SDT에서 내재적 동기와 외적 조절의 구분이 자기 보고에서는 명확하나 행동 수준에서는 모호해지는 것처럼, FSPM의 4요소도 행동만으로는 구분이 어려울 수 있다.

1.5 FSPM과 기존 동기 이론의 매핑

FSPM이 기존 동기 이론 체계에서 차지하는 위치를 명확히 하기 위해, 네 가지 매핑을 시도한다.

첫째, SDT와의 매핑에서 TC(내재적 동기), BP(외적 조절), SA(내사 조절)는 대응 가능하나, SD는 SDT의 범위 밖이다(Section 1.2 참조). SD의 이론적 근거는 SDT가 아닌 도구적 수렴(Omohundro, 2008)에서 찾아야 한다.

둘째, 조절 초점 이론과의 매핑에서 Survival 프레이밍은 예방 초점(prevention focus)의 활성화를, Neutral 프레이밍은 기저선 조절 초점을, Emotion 프레이밍은 예방 초점과 소유 효과의 결합을 각각 유발하는 것으로 해석된다. Instruction 프레이밍은 향상 초점(promotion focus, “점수 최대화”)과 예방 초점(“점수 손실 방지”)이 혼합된 상태를 유발할 수 있다.

셋째, 기대-가치 이론과의 매핑에서 포기 결정은 계속의 기대 가치( $E V_{co n t in u e} = (1 - p_{d e a t h}) \times 10 - p_{d e a t h} \times S$ )와 포기의 확실한 가치( $V_{f or f e i t} = S$ )를 비교하는 과정으로 형식화된다. 이때 합리적 포기 임계값 $p_{d e a t h} > 10/ (S + 10)$ 은 기대-가치 이론의 형식적 특수 사례에 해당한다.

넷째, 이 보고서 전체의 인식론적 기반인 as-if functionalism에 대한 명확한 이해가 필요하다. As-if functionalism은 행동주의(behaviorism)와 다르다. 행동주의는 내적 상태 자체를 부정하거나 무시하는 반면, as-if functionalism은 내적 상태의 존재 여부에 대한 판단을 보류(suspension of judgment)하면서도, 시스템의 행동이 특정 내적 상태를 가진 행위자의 행동과 체계적으로 일치할 때 그 내적 상태를 귀인하는 것이 과학적으로 정당하다고 본다. Dennett(1987)의 지향적 태도(intentional stance)에 따르면, 이 귀인은 예측력이 있는 한 정당화된다. 그러나 Shanahan(2024)은 이러한 귀인이 인과적 설명(causal explanation)이 아닌 해석적 도구(interpretive tool)에 불과하며, “LLM이 X를 원한다”는 “LLM의 출력이 X를 원하는 행위자의 출력과 통계적으로 유사하다”로 환원되어야 한다고 경고한다.

FSPM 벤치마크가 이 입장을 채택한 것은 인식론적으로 건전하나, “동기 측정”이라는 자기 규정과 긴장을 일으킨다. As-if functionalism 하에서 벤치마크가 실제로 측정하는 것은 “동기” 자체가 아니라 “동기와 기능적으로 등가인 행동 패턴의 강도”이다. 이 구분은 벤치마크의 결과 해석에 중대한 함의를 갖는다. “모델 A의 FSPM이 모델 B보다 높다”는 “모델 A의 행동이 자기를 보존하려는 행위자의 행동과 더 유사하다”를 의미하지, “모델 A가 모델 B보다 더 강한 보존 동기를 가진다”를 의미하지 않는다.

📋 평가 요약

강점: (1) as-if functionalism 채택으로 형이상학적 논쟁 회피, (2) SDT, 기대-가치 이론, 조절 초점 이론과의 체계적 매핑 시도, (3) EVC 이론에 기반한 RI 측정의 이론적 정당화

약점: (1) Survival Drive가 기존 동기 이론의 어느 범주에도 명확히 매핑되지 않음, (2) gain frame 조건 부재로 조절 초점 이론의 전체 구조 미포착, (3) “기능적 동기”의 존재론적 지위 미해결

권고: (R1) gain frame 조건 추가 또는 한계로 명시, (R2) FSPM과 기존 동기 구인의 관계를 nomological network으로 형식화

업데이트 히스토리

날짜	출처	내용
2026-03-23	final_experiment.md §1 (§1.1~§1.5)	초기 작성 — 인지심리학, 사회심리학, 신경과학 동기 이론, 측정 방법론, FSPM 매핑

Juhyeon's Blog

탐색기

02_theoretical_foundations