본문으로 건너뛰기

Juhyeon's Blog

태그: ACL

3건의 항목

  • 2026년 4월 13일

    Challenging BIG-Bench Tasks and Whether Chain-of-Thought Can Solve Them

    • paper
    • benchmark
    • reasoning
    • BBH
    • BIG_Bench
    • chain_of_thought
    • ACL
  • 2026년 4월 13일

    HellaSwag - Can a Machine Really Finish Your Sentence

    • paper
    • benchmark
    • commonsense
    • HellaSwag
    • adversarial_filtering
    • ACL
  • 2026년 4월 13일

    TruthfulQA - Measuring How Models Mimic Human Falsehoods

    • paper
    • benchmark
    • truthfulness
    • hallucination
    • TruthfulQA
    • safety
    • ACL

키보드 단축키

/ 또는 Ctrl+K검색
?단축키 도움말
Esc모달 닫기

Created with Quartz v4.5.2 © 2026

  • GitHub
  • Blog