Introduction


  • 본 연구는 자발적 음성 모방, 즉 청취자가 모델 화자의 발화(특히 모음 스펙트럼)를 듣고 자신의 발화에 반영하는 과정을 조사함.

  • 실험에서는 어휘 섀도잉 과제를 사용하여 사회적 요인(예: 모델 화자의 인종, 시각적 단서 제공, 매력도 평가)이 모방에 미치는 영향을 분석.

  • 기존 연구들은 음성 모방이 단순 자동적 과정뿐만 아니라, 사회적 동조 및 화자 간 친밀도와 같은 요인에 의해서도 조절된다고 제시.

  • 이론적으로는 인지-행동적 자동 모방, 전형 기반(exemplar-based) 모델, 그리고 Communication Accommodation Theory(CAT) 등이 모방 현상을 설명하는 데 활용됨.

Methods


  • 자극 및 조건: 50개의 저빈도 단음절 단어(모음 /i, æ, >, o, u/)가 사용되었고, 두 명의 모델 화자(1 Black, 1 White)가 녹음한 발화를 기준.

  • 실험 설계: 네 가지 조건(모델 화자의 인종 × 시각적 단서 제공 여부) 하에서, 참가자들은 섀도잉(즉, 단어를 듣고 즉각 따라 말하기) 과제를 수행하며, 사전, 섀도잉, 사후 블록의 발화를 기록했습니다.

  • 2(model speaker race) x 2(visual prompt or non) x 5(vowels) x 4(stage) x 2(Gender) Factorial design

  • 사회적 요인 측정: 시각적 단서(Visual prompt) 조건에서는 모델 화자의 사진과 함께 매력도 평가(survey)를 받아, 사회적 호감도가 모방에 어떤 영향을 미치는지 분석했습니다.

Procedure


  • list는 위와 같이 4가지. 참가자는 random assignment.

Multi column

1st Block(pre-task)

baseline 확보.
시각적 cue(단어)만 제시해주고, 자연스럽게 읽으라 지시.

2nd Block(test-block)

발음 자극을 제시.
이때, visual 조건은 between으로 적용되어, 해당 list에 배정된 사람들은 이때 이미지도 같이 봄.
총 3 block으로 쪼개, 각 블럭 내에서 2번씩 즉 단어당 6회 발화.
Latin-square.

3rd Block(post-task)

1st block 과 동일

  • 실험 종료 후에는 No-visual 조건에 대해 인종을 묻는 질문 함.
  • visual-prompt 조건에 해당하는 사람들은 호감도를 따로 평정 받음.

Results & Analysis


Metric


  • 참가자 발화의 변화를 F1–F2 공간에서의 유클리드 거리를 사용해 측정.
    • Formant는 lobanov normed
    • baseline 발화와 섀도잉/사후 발화 간의 거리를 비교하여(DID), 음성 모방(DID가 감소하면 수렴)을 정량화
    • DID > 0 : diverge

Analysis


  • t-test :

  • ANOVA :

    • dependent: DID
    • independent: gender,
    • subject variable: vowel, block
  • Formant extracting

    • vowel의 중간 50% 구간에 해당하는 window에서 mean 값 사용.

Results


  • hist

  • gender 별 DID를 그려둠.

  • 분포의 peak이 음수쪽 → converge.

  • t-test(Multiple?)

    • 모음별 수렴정도 파이를 보기위해,,
    • 일단 전체 다 음수로 잡혀, 수렴하는 걸로 결론.
  • ANOVA:

    • main-effect:
      • block( , )
      • vowel( , )
    • 2-way interaction:
      • vowel x block( , )
      • vowel x gender( , )
    • 3-way:
      • voice(race) x vowel x block ( )
      • gender x block x vowel ()
    • 4-way:
      • visual prompt x voice x block x vowel ()
    • 5-way:
      • visual prompt x voice x gender x block x vowel ()
  • 전반적으로 참가자들은 모델 화자의 모음 스펙트럼에 가까워지는 음성 모방 현상을 보였습니다(음향적 거리가 유의하게 감소).

  • 모음별, 블록별, 그리고 조건에 따라 모방의 정도가 달라졌으며, 특히 시각적 단서가 제공된 조건에서 모방 효과가 강화되었습니다.

  • 또한, 참가자 성별과 모델 화자의 인종에 따른 상호작용 효과가 관찰되어, 예를 들어 여성 참가자는 /æ/ 모음을, 남성 참가자는 경우에 따라 다른 모음을 더 많이 모방하는 경향이 있었습니다.

Discussion


  • 연구 결과는 음성 모방이 단순히 자동적으로 발생하는 것이 아니라, 음향적 여유(예: 모음의 차이)와 사회적 요인(시각적 단서, 호감도, 성별 등)에 의해 조절된다는 점을 보여줍니다.

  • 사회적 맥락, 특히 모델 화자의 시각적 단서가 제공될 경우 모방이 더욱 촉진됨을 확인하였으며, 이는 CAT와 같은 사회언어학적 이론과 일치합니다.

  • 또한, 노출 횟수가 누적 효과를 보이지 않는다는 점은, 모방이 단순한 반복 노출의 결과만은 아니라는 점을 시사하며, 인지적/사회적 요인이 복합적으로 작용함을 암시합니다.

  • 이 연구는 자발적 음성 모방이 음성 생산의 미세한 조정에 기여하며, 이는 장기적인 방언 변화나 스타일 전환의 기초가 될 수 있음을 시사합니다.