본문으로 건너뛰기
Juhyeon's Blog
Search
검색
다크 모드
라이트 모드
탐색기
태그: HumanEval
2건의 항목
2026년 6월 04일
Evaluating Large Language Models Trained on Code
paper
benchmark
code_generation
HumanEval
pass_at_k
Codex
OpenAI
2026년 6월 04일
Is Your Code Generated by ChatGPT Really Correct! Rigorous Evaluation of Large Language Models for Code Generation
paper
LLM
code-generation
benchmark
evaluation
EvalPlus
HumanEval
MBPP
mutation-testing
differential-testing
NeurIPS2023