Participants


총:49명 분석 대상

전체 LY실험 중 음성수렴이 진행된 범위는 LY001 ~ LY062(62명)
제외 대상은 아래와 같음.

  • pilot 및 초기 실험 세팅 변경(6명): LY001, LY003, , LY012, LY014, LY016, LY018
  • 2차 실험 제외(1명): LY049
  • 실험 미 이해(1명) : LY059
  • 설문 미 실시(2명) : LY43, LY52
  • 분석 중 탈락 - 일부 반응 누락(3명): LY025, LY057, LY058
    따라서 62 - 13 = 49 명

Lobanov(개인 내 Z-scoring)


음성학 분야에서 많이 사용되는 정규화로, 개인 간 편차를 줄이기 위해 하는 개인 내 z-score 변환(주로 모음 대상으로 사용된다고 함.)

  • 개인내 모든 모음에 대해서 z-scoring을 하는 걸로 fix.

  • : 정규화된 n 번째 Formant 값.
  • : 특정 모음(V)의 n 번째 포먼트 값.
  • : 해당 화자의 모든 모음에 대한 n 번째 Formant()의 평균
  • : 해당 화자의 모든 모음에 대한 의 std.

Metric define


  • 에서 Euclidean distance (Z-score normed)
  • Vowel Length

lobanov를 기준으로 수렴 여부를 판단?


Multi column

orignal

lobanov normed

  • ae 발음을 보면, normalization 전의 값들은 수렴하지만, normalization(z-score) 이후에는 발산으로 경향이 바뀌었다.
  • 고민해보아야 할 포인트는 음성 수렴이라는 현상 자체가 formant(hz)d에 다가하는게 중점일지, 아니면 조음 위치가 닮아가는게 중점일지 고민해보아야 함.
  • z-scoring을 하면, 개인차는 없앨 수 있지만, 조음 공간을 포함하여 해석할 수 있게겠지. 근데 그러면 그 metric은 수렴의 지표로써 사용할 수 있나? (타당성)

우리가 보려는 건 음성 수렴이잖아. 이게 포먼트가 닮는다고 조음 위치 수렴이라고 할 수 있을까?
일대일 대응 관계인지 한 번 생각해보고, 이것 때문에 정규화를 하면 안 될지도,,

Result


trajectory(original_formant vs lobanov norm) - 개인별 분석


Multi column

original-freq

lobanov Normalized

Group 간 분석


아래는 vowel의 구분 없이 mid-point 의 formant의 mean value.

Multi column

original distance

Identity Of Model(exp list)stage2stage4stage5stage6
AI243.890025223.523232228.252480241.290115
Human239.136157236.261951239.320735236.621678

lobanov normed - distance

Identity Of Model(exp list)stage2stage4stage5stage6
AI0.3806540.2673840.2756150.344808
Human0.3457550.3025110.2925200.343667
  • 기본적인 가설 및 지지 여부
    • stage 2 4: 모델 화자에 대한 인지적 정보를 제공하지 않았으니, 일반적으로 수렴 예상
      • 모든 지표에 대해 수렴. 예상에 부합.
        • 정보가 주어지지 않았으니 일반적인 사람 목소리라고 인식헀겠지.
    • stage4 5: 모델 화자에 대한 정보가 주어졌으니, 수렴 여부 양상이 달라질거라 예상.
      • AI: normalized 여부에 관계 없이 모두 발산. 예상을 지지.
      • Human: normalized를 한 경우에만 수렴을 지지. normed value만 예상에 부합.
        • stage 4 5를 더 잘 설명하는 건, normed를 한 걸 사용하는게 나을 것 같긴 하네.
    • stage 5 6: 음원을 제시하지 않으니 기본적으로 발산 양상 예상.
      • AI: normalized를 한 경우에만 수렴을 지지. 예상에 부합.
      • Human: normalized를 한 경우에만 수렴을 지지. normed value만 예상에 부합.
        • stage 5 6를 더 잘 설명하는 건, normed를 한 걸 사용하는게 나을 것 같긴 하네.

정리하자면, 예상을 더 잘 설명하는 건, normalized 된 값들 임.

Phone Analysis


Multi column

a

ae

i

o

u

Multi column

Mean-val

PhoneIdentity Of Model(exp list)stage2stage4stage5stage6가설 지지 여부
aAI0.4783100.3248960.3183130.455947X
Human0.4866590.3252670.3379250.421505X
aeAI0.3749680.3593650.3373940.331823X
Human0.3204070.3254780.3406550.365667X
iAI0.5008380.2892160.2797180.407559X
Human0.3767170.3097860.2489170.349673V
oAI0.2396980.2020510.2487650.253516V
Human0.3142060.3101110.2955480.315131V
uAI0.3094560.1613900.1938860.275194V
Human0.2307850.2419110.2395570.266359V

Median-val

PhoneIdentity Of Model(exp list)stage2stage4stage5stage6가설 지지 여부
aAI0.4343930.2812310.2862070.475222V
Human0.4584770.2998970.2893290.366543V
aeAI0.3475520.3237330.3513490.332473V
Human0.2575980.2884330.2855310.257959V
iAI0.3972740.2584810.2461810.321188X
Human0.3666690.2661270.2294740.344216V
oAI0.2213040.2230430.2353880.240119V
Human0.2236370.2537300.2324070.293193V
uAI0.2758220.1709310.1708190.249657X
Human0.1950520.1353100.1374760.183026X
  • Mean 값 기준으로 단순 경향 분석에서는 boxplot이랑 좀 상반되게 나오기긴 하는데,
    • 이럴만한 이유는 샘플 수가 작다는 점??

Statistical Analysis


ANOVA + Tukey-HSD


현재 보려고 하는 변수들은 총 2가지 perceived Identity of Model,

  • Babel(2012) paper 참고하여 분석 어떻게 하는지 확인해보고, 저번에 발표자료로 쓴 선행 연구 정리된 표에서 AXB 말고 우리가 하는 Euclidean-distance 중심으로 수렴 판단하는 선행 연구들에서 분석 어떻게 하는지 확인할 것.