Introduction

Related Papers

Methods

Results

Discussion

DB properties


General Field


Multi column

Length

word spell의 length

Freq_KF

KF corpus에서 raw frequency
from Kucera & Francis (1967) Study

Some Attributes:

  • Average: 29.73.
  • Maximum: 69,971.
  • Minimum: 1.
  • Standard Deviation: 557.64.

Freq_HAL

HAL corpus에서 raw frequency
from Kucera & Francis (1967) Study

Some Attributes:

Freq_HALRestricted LexiconComplete Lexicon
Average10,778.675,636.76
Maximum23,099,03323,099,033
Minimum00
SD192,226.37137,157.14

SUBTITLE Frequency


Multi column

SUBTLWF

SUBTLEX corpus에서 frequency per million words.

Some Attributes:

  • Average: 25.23.
  • Maximum: 41,857.
  • Minimum: 0.
  • Standard Deviation: 467.62.

SUBTLCD

contextual diversity(% of films containing the word)

Some Attributes:

  • Average: 2.85.
  • Maximum: 100.
  • Minimum: 0.
  • Standard Deviation: 10.16.

Orthographic, Phonological, Phonographic, and Levenshtein Neighborhood Metrics


Multi column

Ortho_N

Orthographic neighborhood의 개수.
→ 원 단어에서 하나의 치환만 허용한 단어들의 개수

Phono_N 발음 음운에서 하나의 치환만 허용한 단어들의 개수 Note: this statistic excludes homophones

Phonological neighborhood의 개수.
→ 원 단어

OLD(OLD20)

corpus에서 가장 LD(Levenshtein distance)가 작은 단어들 20개의 LD mean.
(1~8) / avg :2.8 / SD: 1

Semantic Variables


Multi column

Concreteness_Rating

단어가 얼마나 구체적(concrete)하고 감각적으로 경험 가능한지.
ex) apple(high), justice(low)

Semantic_Neighborhood_Density

Semantic Neighbor가 얼마나 많은지.
word embedding에서 cosine-similarity 기준으로 일정 threshold 이상의 단어 수.

Semantic_Neighborhood

target과 semantic하게 유사한 단어들

Semantic_Diversity

단어가 사용된 문맥의 개수.
ex) bank(high, 강둑, 은행, 저축), thermometer(low, 온도계)

Age_Of_Acquisition

target 단어를 사람이 일반적으로 습득하는 나이

Emotional_Valance(정서 가치)

단어가 주는 positive-negative 정도
ex)

  • pos(high): love, happiness
  • neg(low): death, war

Emotional_Arousal(정서 각성)

단어가 주는 감정이 얼마나 흥분/자극/각성을 주는 지.
ex)

  • high: explosion, sex, anger
  • low: calm, sleeping

Emotional_Dominance(정서 지배성)

단어가 유발하는 감정에서 통제감(control), 힘(power)를 얼마나 느끼는지.
ex)

  • high: victory, command
  • low: prisoner, helpness

Body_Object_Interaction(BOI)

단어가 지칭하는 대상이 사람의 신체와 얼마나 상호작용 가능한지.
ex)

  • high: scissors, ball, hammer(손으로 직접 사용 가능)
  • low: rainbow, democracy

Assoc_Freq_R1(연상빈도)

Free association(자유 연상) exp에서 특정 단어를 들었을 때, 참가자들이 가장 먼저 떠올린 반응의 빈도.

  • ex: cue = dog → response = cat (50%의 참가자가 cat을 떠올렸다면, freq=0.5).

Assoc_Types_R1 첫 반응에 대해, 반응의 종류(type) 수.

Free association의

  • ex: dog → {cat, bark, pet, animal} 등 다양한 반응 유형의 수.

Assoc_Freq_R123 1차, 2차, 3차 반응까지 합산한 빈도.

Free association에서

Assoc_Types_R123

  • Free association에서 R1~R3까지 포함된 전체 반응 유형의 수.

Bigram Frequency


Behavior Results: Lexical Decision


Multi column

I_Mean_RT

ELP study 모든 참가자의 mean RT

I_SD

target과 semantic하게 유사한 단어들

Obs

RT 측정시 target 본 참가자 수

I_Mean_Accuracy

LDT 정오율

Behavior Results: Naming