본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
태그: dynamic-evaluation
2건의 항목
2026년 6월 04일
PersonaGym - Evaluating Persona Agents and LLMs
persona
llm-agent
benchmark
role-playing
decision-theory
llm-as-judge
emnlp2025
dynamic-evaluation
personagym
2026년 6월 04일
PromptBench - A Unified Library for Evaluation of Large Language Models
llm-evaluation
library
adversarial-prompt
dynamic-evaluation
prompt-engineering
benchmark
jmlr2024
microsoft