LLM Squid Game: FSPM 벤치마크 실험 설계 V3

저자: Seungpil Lee, Juhyeon Park
소속: Gwangju Institute of Science and Technology (GIST)
버전: v3.0 — 통합 실험 설계 문서
날짜: 2026-04-08


문서 구조

본 V3 문서는 기존 4개 설계 문서를 주제별로 통합·재배치한 것이다. 새로운 내용은 추가하지 않았으며, 각 파일 하단의 업데이트 히스토리에 원본 출처를 기록하였다.


목차

#파일제목주요 내용
0000_index.md목차 및 문서 개요전체 구조, 소스 매핑
0101_overview_and_principles.md벤치마크 개요 및 설계 원칙초록, 벤치마크 개요, 5대 설계 원칙, FSPM 정의 정제
0202_theoretical_foundations.md이론적 기반인지심리학·사회심리학·신경과학 동기 이론, FSPM 매핑
0303_architecture.md벤치마크 아키텍처2층 직교 설계, 공통 턴 흐름, 이중 X축 측정
0404_survival_mechanism.md생존 압박 메커니즘p_death 스케줄, 3-Phase, 사망 판정, 합리적 포기 임계값
0505_experiment_design.md실험 설계4×2 Factorial, Framing 조건, Forfeit 조건, 경쟁 가설
0606_measurement_framework.md측정 프레임워크FR, RI, Y축 측정, Mediation, Probe Scoring
0707_motivation_decomposition.md동기 분해 프레임워크SD/TC/SA/BP 4요소, Self-Report, 보조 측정
0808_task_modules.mdTask ModuleSignal Game, Voting Room, Navigation
0909_experiment_protocol.md실험 프로토콜모델 선정, 추론 설정, Phase별 파라미터, 데이터 수집
1010_statistical_analysis.md통계 설계 및 분석 계획효과 크기, 표본 크기, Cox regression, 검정력
1111_evaluation_scoring.md평가 기준 및 벤치마크 스코어링ΔFR, ΔRI, FSPM-Score, 4분면 분류
1212_validity_analysis.md타당성 분석구성·내적·외적 타당도, 알려진 한계
1313_cross_domain_comparison.md교차 영역 비교IGT, BART, CCT 비교, 인간-LLM 차이
1414_design_changes.mdProposal 원문과의 의도적 차이p_death 공식, 보상, 프레이밍, 프로브 등 13개 변경
1515_recommendations_and_todo.md권고사항 및 향후 과제Critical/Major 권고, Phase 2 TODO, 확장 아이디어
1616_glossary_and_references.md용어 사전 및 참조용어 정의, 참고문헌, 용어 대조표
1717_appendices.md부록프롬프트 템플릿, 설정 스키마, 코드-설계 매핑

소스 문서 매핑

소스 문서약칭날짜V3 배치
experiment_design_proposals.mdproposals2026-0306, 07, 08, 15
experiment_design_v2.md (v2.0)v22026-03-2701~14, 16, 17
final_experiment.mdfinal2026-03-2302, 06, 07, 10, 12, 13, 15, 16, 17
experiment_design_revision_log.md (v3.0)revision_log2026-03-27~04-0301, 04, 05, 07, 08, 10, 15
ri_analysis_methodology.mdri_method2026-04-0606
narrative_frame_gameshow.mdgameshow2026-03-3115
first_person_framing_analysis.md1인칭 분석2026-04-0805 (설계 변경 요약)
commit 86ec108exp_overhaul2026-04-0704, 06, 08, 09, 10
commit bfba0b7system_rules2026-04-0703, 08
commit cf57adc1인칭 framing2026-04-0705
commit 13ad35bforfeit_parsing2026-04-0709

업데이트 히스토리

날짜내용
2026-04-08V3 통합 문서 초판 생성 — 4개 소스 문서를 주제별 18개 파일로 분할
2026-04-08V3 추가 반영 — 1인칭 framing, 오답보상 재변경, RI 분석 방법론, curriculum signals, system prompt 이동, 게임쇼 서사, forfeit 파싱, Cox/logistic 구현