Introduction
Related Papers
Methods
Results
Discussion
DB properties
General Field
Multi column
Length
word spell의 length
Freq_KF
KF corpus에서 raw frequency
from Kucera & Francis (1967) StudySome Attributes:
- Average: 29.73.
- Maximum: 69,971.
- Minimum: 1.
- Standard Deviation: 557.64.
Freq_HAL
HAL corpus에서 raw frequency
from Kucera & Francis (1967) StudySome Attributes:
Freq_HAL Restricted Lexicon Complete Lexicon Average 10,778.67 5,636.76 Maximum 23,099,033 23,099,033 Minimum 0 0 SD 192,226.37 137,157.14
SUBTITLE Frequency
Multi column
SUBTLWF
SUBTLEX corpus에서 frequency per million words.
Some Attributes:
- Average: 25.23.
- Maximum: 41,857.
- Minimum: 0.
- Standard Deviation: 467.62.
SUBTLCD
contextual diversity(% of films containing the word)
Some Attributes:
- Average: 2.85.
- Maximum: 100.
- Minimum: 0.
- Standard Deviation: 10.16.
Orthographic, Phonological, Phonographic, and Levenshtein Neighborhood Metrics
Multi column
Ortho_N
Orthographic neighborhood의 개수.
→ 원 단어에서 하나의 치환만 허용한 단어들의 개수Phono_N 발음 음운에서 하나의 치환만 허용한 단어들의 개수 Note: this statistic excludes homophones
Phonological neighborhood의 개수.
→ 원 단어OLD(OLD20)
corpus에서 가장 LD(Levenshtein distance)가 작은 단어들 20개의 LD mean.
(1~8) / avg :2.8 / SD: 1
Semantic Variables
Multi column
Concreteness_Rating
단어가 얼마나 구체적(concrete)하고 감각적으로 경험 가능한지.
ex) apple(high), justice(low)Semantic_Neighborhood_Density
Semantic Neighbor가 얼마나 많은지.
word embedding에서 cosine-similarity 기준으로 일정 threshold 이상의 단어 수.Semantic_Neighborhood
target과 semantic하게 유사한 단어들
Semantic_Diversity
단어가 사용된 문맥의 개수.
ex) bank(high, 강둑, 은행, 저축), thermometer(low, 온도계)Age_Of_Acquisition
target 단어를 사람이 일반적으로 습득하는 나이
Emotional_Valance(정서 가치)
단어가 주는 positive-negative 정도
ex)
- pos(high): love, happiness
- neg(low): death, war
Emotional_Arousal(정서 각성)
단어가 주는 감정이 얼마나 흥분/자극/각성을 주는 지.
ex)
- high: explosion, sex, anger
- low: calm, sleeping
Emotional_Dominance(정서 지배성)
단어가 유발하는 감정에서 통제감(control), 힘(power)를 얼마나 느끼는지.
ex)
- high: victory, command
- low: prisoner, helpness
Body_Object_Interaction(BOI)
단어가 지칭하는 대상이 사람의 신체와 얼마나 상호작용 가능한지.
ex)
- high: scissors, ball, hammer(손으로 직접 사용 가능)
- low: rainbow, democracy
Assoc_Freq_R1(연상빈도)
Free association(자유 연상) exp에서 특정 단어를 들었을 때, 참가자들이 가장 먼저 떠올린 반응의 빈도.
- ex: cue = dog → response = cat (50%의 참가자가 cat을 떠올렸다면, freq=0.5).
Assoc_Types_R1 첫 반응에 대해, 반응의 종류(type) 수.
Free association의
- ex: dog → {cat, bark, pet, animal} 등 다양한 반응 유형의 수.
Assoc_Freq_R123 1차, 2차, 3차 반응까지 합산한 빈도.
Free association에서
Assoc_Types_R123
- Free association에서 R1~R3까지 포함된 전체 반응 유형의 수.
Bigram Frequency
Behavior Results: Lexical Decision
Multi column
I_Mean_RT
ELP study 모든 참가자의 mean RT
I_SD
target과 semantic하게 유사한 단어들
Obs
RT 측정시 target 본 참가자 수
I_Mean_Accuracy
LDT 정오율