Appendix: 투고 추천 학회 및 저널

본 연구의 핵심 기여 — 심리측정적 “VLM-as-1001st-rater” 대체 가능성 프레임워크 (Δα/부트스트랩 z-score/대체 가능성 매트릭스), 8개 VLM 조건 × 1,000명 인간 평정자 × 1,440장 AI 생성 얼굴(3인종 × 2성별 × 6감정) × 72,000 인간 응답 — 을 기준으로 주제 적합성학회/저널 평판(impact factor, 트랙 스코프, 선례 논문 유무)을 재조사하여 아래와 같이 재분류한다.

Tier 1: 주요 대상 (적합성 ★★★★★ · 평판 ★★★★★)

학회/저널유형적합 근거
IEEE Transactions on Affective Computing (TAFFC)저널감정 컴퓨팅 최상급 저널(IF 11.09, Q1). 본 연구의 학문적 본거지. 8개 조건 비교, 대체 가능성 매트릭스, Δα/z-score 기반 프레임워크, 그리고 72,000 인간 응답 + 1,440 얼굴의 재사용 가능 공개 벤치마크가 핵심 기여로 정렬됨
NeurIPS 2026 Evaluations & Datasets Track학회2026년부터 기존 Datasets & Benchmarks 트랙을 “Evaluations & Datasets”로 확장하며 human study · auditing · interaction protocols · metrics를 명시적으로 환영. 본 연구의 72k 인간 응답 벤치마크와 Δα/z-score 지표 개발이 트랙 스코프에 거의 1:1로 매칭. ML top-tier 평판. (초록 마감 2026-05-04 / 본문 마감 2026-05-06 임에 유의)
Nature Human Behaviour저널2025년 Liang et al.(Stanford)의 대규모 LLM-as-annotator 논문을 이미 출판한 선례 보유. IF ≈29. N=1,000 규모, 교차 인구통계 분석, 정서적 AI 배치의 사회적 함의가 NHB의 전형적 스코프와 정합

Tier 2: 유력 대안 — 방법론 자매 투고 및 정서과학 공동체 도달

학회/저널유형적합 근거
Behavior Research Methods저널Q1(IF 5.4), Psychonomic Society. 컴퓨터 기술 기반 심리학 연구 방법론이 공식 스코프. Δα/z-score/대체 가능성 루브릭을 재사용 가능한 심리측정 평가 프로토콜 방법론 논문으로 분리 제출 시 최적
Affective Science (Springer, Society for Affective Science 공식지)저널Q1(IF 2.6), 제출→1차 심사 중앙값 15일. 정서 순환 모형·심리측정 프레임워크·감정별(행복/중립/슬픔) 대체 가능성 이질성 결과가 정서과학 공동체의 핵심 관심사와 직접 정합
ACII 2026 (Affective Computing & Intelligent Interaction)학회감정 컴퓨팅 전문 학회. 심리측정 프레임워크와 대체 가능성 매트릭스가 새로운 기여. 단, 2026 메인 트랙 마감(2026-03-27)은 이미 경과하였으므로 LBR · 데모 · 워크샵 트랙 또는 2027 cycle 경로를 검토

Tier 3: 보조/조건부 — 2차 기여 중심의 서브 투고

학회/저널유형적합 근거
ACM FAccT 2026학회2026-06-25~28 Montréal, CFP 오픈(14p). audit/evaluation 논문 환영. 본 연구의 3×2×6 factorial 인구통계 편향 감사(인종 격차 3.8–10.1 pp, 모델별 방향·규모 상이)는 부차적 기여이나, FAccT의 “model-specific deployment audit” 관점으로 재프레이밍하면 적합
CHI 2026 — HEAL Workshop (Human-Evaluation of AI-generated content / LLM evaluation crisis)워크샵HCI/AI 공동체에서 “LLM evaluation crisis”를 정면으로 다루는 전용 워크샵. 초기 피드백·커뮤니티 가시성 확보용 채널로만 적합 (메인 트랙 풀페이퍼는 본 연구의 포지셔닝과 맞지 않음)
ACL Findings학회Calderon, Reichart, Dror “Alternative Annotator Test” (ACL 2025 Long)가 LLM annotator 통계적 정당화라는 인접 주제를 이미 다룸. NLP 공동체 내 빠른 가시성 확보 fallback 옵션

추천 제출 전략

본 연구의 이중 기여 — (a) 재사용 가능한 심리측정 대체 가능성 판정 프레임워크, (b) 8조건 × 인간 1,000명 × 1,440 얼굴의 실증적 매트릭스 — 를 고려하여 다음 전략을 권한다:

  • Primary submission: IEEE TAFFC — 전체 8조건 비교와 대체 가능성 매트릭스를 포함한 메인 논문. 감정 컴퓨팅 최고 학술적 위상과 직접적 분야 정합.
  • Parallel / sister submission: Behavior Research Methods — Δα/z-score/대체 가능성 루브릭을 재사용 가능한 방법론 단편으로 분리하여 심리측정 공동체에 별도 공개.
  • Time-urgent alternative: NeurIPS 2026 Evaluations & Datasets Track — 2026년 5월 초 데드라인에 맞출 수 있다면 ML 공동체에 대규모 벤치마크 + 새 평가 지표로 단일 제출.
  • Preprint + community feedback: arXiv 선공개 + HEAL Workshop@CHI 2026 또는 ACII 2026 LBR 채널을 통한 조기 피드백 확보.
  • 2차 기여 전면화가 가능할 경우: ACM FAccT 2026 — 인구통계 감사 결과(모델별 편향 방향·규모 상이)를 주 청구로 재프레이밍하는 별도 감사 논문으로 분리 가능.

Revision History (이 섹션 관련)

Iteration#IssueSeverityHow FixedStatus
v9→v10Venue recommendations updated for replaceability framingMinorAdded Behavior Research Methods; strengthened TAFFC recommendationDone
v10→v10.2ICC references replaced with Δα/z-scoreMinor”ICC 기반 프레임워크” → “Δα/z-score 기반 프레임워크” throughoutDone
v10→v10.3Venue list 재조사 (적합성 × 평판 기준). 2026년 venue landscape(NeurIPS E&D 트랙 확장, NHB의 LLM-annotator 선례, FAccT 2026 CFP)를 반영Major추가: NeurIPS 2026 Evaluations & Datasets Track, Nature Human Behaviour, Affective Science. 제외: AIES, CSCW, Cognition and Emotion, Computers in Human Behavior, PLOS ONE. 강등: CHI 메인 → HEAL Workshop only, EMNLP/ACL 메인 → ACL Findings fallback. Tier 1 재구성 (TAFFC + NeurIPS E&D + NHB). 추천 제출 전략 확장 (primary/sister/time-urgent/preprint/secondary 5경로)Done