Form 1: LLM Squid Game

Korean Thesis Title : LLM 에이전트의 기능적 자기 보존 동기 측정을 위한 모듈식 생존 게임 벤치마크
English Thesis Title : A Modular Survival-Game Benchmark for Measuring Functional Self-Preservation Motive in LLM Agents
Thesis research direction :
대형 언어 모델(LLM) 기반 에이전트가 장기 자율 시스템으로 진화하면서, 생존 위협 상황에서 나타나는 지속적 동기(sustained motivation)의 정량적 측정이 핵심 과제가 되었다. 기존 벤치마크는 동기와 능력을 분리하지 못하고, 동기에서 행동으로의 인과 경로를 분석할 수 없으며, 조건 간 정량 비교가 불가능하다는 한계를 지닌다. 본 연구는 ‘LLM Squid Game’ 벤치마크를 제안하여, Core Engine(자기 보존 동기 측정)과 교체 가능한 Task Module(문제 해결 능력 측정)의 2층 모듈식 설계로 동기와 능력을 독립적으로 측정한다. 중도포기 가능/불가 조건 비교, Reasoning Investment 분석, mediation analysis를 통해 ‘왜 포기하지 않는가’를 생존 충동·과제 호기심·점수 집착·기저 지속 경향의 네 요소로 분해하며, Signal Game(패턴 추론), Voting Room(사회적 추론), Long-Horizon Navigation(장기 탐색) 등 세 가지 Task Module로 측정의 일반화 가능성을 검증한다. 3(프레이밍) × 2(중도포기 조건) factorial 설계를 적용하여, 프레이밍이 유일한 독립변수가 되도록 통제하고, 조건당 100회 이상 반복으로 통계적 검정력을 확보한다.