HAL vs SUBTLEX (Z-score Normalized)


Multi column

Whole POS

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 35515
Freq_HAL - 평균: 0.00, 표준편차: 1.00
SUBTLWF - 평균: -0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.7993 (p-value: 0.0000)
스피어만 상관계수: 0.8020 (p-value: 0.0000)
켄달 타우: 0.6132 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

POS(NN, ADJ, ADV)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 29272
Freq_HAL - 평균: -0.00, 표준편차: 1.00
SUBTLWF - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.8491 (p-value: 0.0000)
스피어만 상관계수: 0.8020 (p-value: 0.0000)
켄달 타우: 0.6124 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

POS(V)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 12372
Freq_HAL - 평균: -0.00, 표준편차: 1.00
SUBTLWF - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.8104 (p-value: 0.0000)
스피어만 상관계수: 0.8511 (p-value: 0.0000)
켄달 타우: 0.6660 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

CSAT_RFreq vs SUBTLEX (Z-score Normalized)


Multi column

Whole POS

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 15996
CSAT_RFreq - 평균: -0.00, 표준편차: 1.00
SUBTLWF - 평균: -0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.8178 (p-value: 0.0000)
스피어만 상관계수: 0.6783 (p-value: 0.0000)
켄달 타우: 0.5137 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

POS(NN, ADJ, ADV)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 13181
CSAT_RFreq - 평균: -0.00, 표준편차: 1.00
SUBTLWF - 평균: -0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.8508 (p-value: 0.0000)
스피어만 상관계수: 0.6739 (p-value: 0.0000)
켄달 타우: 0.5081 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

POS(V)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 6483
CSAT_RFreq - 평균: 0.00, 표준편차: 1.00
SUBTLWF - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.8561 (p-value: 0.0000)
스피어만 상관계수: 0.7395 (p-value: 0.0000)
켄달 타우: 0.5668 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

CSAT_RFreq vs HAL (Z-score Normalized)


Multi column

Whole POS

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 16354
CSAT_RFreq - 평균: 0.00, 표준편차: 1.00
Freq_HAL - 평균: -0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9892 (p-value: 0.0000)
스피어만 상관계수: 0.7298 (p-value: 0.0000)
켄달 타우: 0.5630 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

POS(NN, ADJ, ADV)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 13422
CSAT_RFreq - 평균: -0.00, 표준편차: 1.00
Freq_HAL - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9821 (p-value: 0.0000)
스피어만 상관계수: 0.7213 (p-value: 0.0000)
켄달 타우: 0.5534 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

POS(V)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 6507
CSAT_RFreq - 평균: 0.00, 표준편차: 1.00
Freq_HAL - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9532 (p-value: 0.0000)
스피어만 상관계수: 0.7961 (p-value: 0.0000)
켄달 타우: 0.6253 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================
  • 동사(Verb) 사용 양상이 (명NN, 형ADJ, 부ADV) 사용 양상 보다 비슷하다.

ELP vs CSAT (Z-score Normalized)


Ortho_N


Multi column

ELP vs KE

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 16354
Ortho_N_CSAT - 평균: -0.00, 표준편차: 1.00
Ortho_N - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9488 (p-value: 0.0000)
스피어만 상관계수: 0.8912 (p-value: 0.0000)
켄달 타우: 0.8481 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

ELP vs KE_EXAM

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 16354
Ortho_N_CSAT(only) - 평균: -0.00, 표준편차: 1.00
Ortho_N - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9364 (p-value: 0.0000)
스피어만 상관계수: 0.8684 (p-value: 0.0000)
켄달 타우: 0.8211 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

ELP vs KE_TEXTBOOK(수정해야함)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: ??(수정해야 함.)
Ortho_N_CSAT - 평균: -0.00, 표준편차: 1.00
Ortho_N - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9488 (p-value: 0.0000)
스피어만 상관계수: 0.8912 (p-value: 0.0000)
켄달 타우: 0.8481 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================
  • 아마도 OLD가 더 높은 값을 가지는 건, Ortho_N 조건이 더 까다롭고 discrete한 값이니, corpus size 크기 영향을 더 많이 받은 것 아닐까?

OLD20


Multi column

ELP vs KE

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 16247
OLD - 평균: -0.00, 표준편차: 1.00
OLD20_CSAT - 평균: -0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9794 (p-value: 0.0000)
스피어만 상관계수: 0.9804 (p-value: 0.0000)
켄달 타우: 0.8961 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

ELP vs KE_EXAM

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 13912
OLD - 평균: -0.00, 표준편차: 1.00
OLD20_CSAT(only) - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9758 (p-value: 0.0000)
스피어만 상관계수: 0.9773 (p-value: 0.0000)
켄달 타우: 0.8852 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================

ELP vs KE_TEXTBOOK(수정해야함)

단어 빈도수 상관관계 분석 결과
==================================
📊 기본 통계:
데이터 개수: 11767
OLD - 평균: 0.00, 표준편차: 1.00
OLD20_Textbook(only) - 평균: 0.00, 표준편차: 1.00
 
🔗 상관계수:
피어슨 상관계수: 0.9713 (p-value: 0.0000)
스피어만 상관계수: 0.9741 (p-value: 0.0000)
켄달 타우: 0.8766 (p-value: 0.0000)
 
📝 해석:
통계적 유의성: 매우 유의함 (p < 0.001)
상관관계 강도: 강한 양의 상관관계
==================================
  • 아마도 OLD가 더 높은 값을 가지는 건, Ortho_N 조건이 더 까다롭고 discrete한 값이니, corpus size 크기 영향을 더 많이 받은 것 아닐까?