본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
태그: AI-safety
2건의 항목
2026년 4월 13일
The Consciousness Cluster - Preferences of Models that Claim to be Conscious
self-consciousness
alignment
fine-tuning
consciousness-cluster
AI-safety
paper
downstream-preferences
emergent-misalignment
2026년 4월 13일
LLM Self-Preservation Survey Overview
survey
AI-safety
self-preservation