Introduction

본 연구는 자발적 음성 모방, 즉 청취자가 모델 화자의 발화(특히 모음 스펙트럼)를 듣고 자신의 발화에 반영하는 과정을 조사함.
실험에서는 어휘 섀도잉 과제를 사용하여 사회적 요인(예: 모델 화자의 인종, 시각적 단서 제공, 매력도 평가)이 모방에 미치는 영향을 분석.
기존 연구들은 음성 모방이 단순 자동적 과정뿐만 아니라, 사회적 동조 및 화자 간 친밀도와 같은 요인에 의해서도 조절된다고 제시.
이론적으로는 인지-행동적 자동 모방, 전형 기반(exemplar-based) 모델, 그리고 Communication Accommodation Theory(CAT) 등이 모방 현상을 설명하는 데 활용됨.

Methods

자극 및 조건: 50개의 저빈도 단음절 단어(모음 /i, æ, >, o, u/)가 사용되었고, 두 명의 모델 화자(1 Black, 1 White)가 녹음한 발화를 기준.
실험 설계: 네 가지 조건(모델 화자의 인종 × 시각적 단서 제공 여부) 하에서, 참가자들은 섀도잉(즉, 단어를 듣고 즉각 따라 말하기) 과제를 수행하며, 사전, 섀도잉, 사후 블록의 발화를 기록했습니다.
2(model speaker race) x 2(visual prompt or non) x 5(vowels) x 4(stage) x 2(Gender) Factorial design
사회적 요인 측정: 시각적 단서(Visual prompt) 조건에서는 모델 화자의 사진과 함께 매력도 평가(survey)를 받아, 사회적 호감도가 모방에 어떤 영향을 미치는지 분석했습니다.

Procedure

list는 위와 같이 4가지. 참가자는 random assignment.

Multi column

1st Block(pre-task)

baseline 확보.
시각적 cue(단어)만 제시해주고, 자연스럽게 읽으라 지시.

2nd Block(test-block)

발음 자극을 제시.
이때, visual 조건은 between으로 적용되어, 해당 list에 배정된 사람들은 이때 이미지도 같이 봄.
총 3 block으로 쪼개, 각 블럭 내에서 2번씩 즉 단어당 6회 발화.
Latin-square.

3rd Block(post-task)

1st block 과 동일

실험 종료 후에는 No-visual 조건에 대해 인종을 묻는 질문 함.
visual-prompt 조건에 해당하는 사람들은 호감도를 따로 평정 받음.

Results & Analysis

Metric

참가자 발화의 변화를 F1–F2 공간에서의 유클리드 거리를 사용해 측정.
- Formant는 lobanov normed
- baseline 발화와 섀도잉/사후 발화 간의 거리를 비교하여(DID), 음성 모방(DID가 감소하면 수렴)을 정량화
- DID > 0 : diverge

Analysis

t-test :
ANOVA :
- dependent: DID
- independent: gender,
- subject variable: vowel, block
Formant extracting
- vowel의 중간 50% 구간에 해당하는 window에서 mean 값 사용.

Results

hist
gender 별 DID를 그려둠.
분포의 peak이 음수쪽 → converge.
t-test(Multiple?)
- 모음별 수렴정도 파이를 보기위해,,
- 일단 전체 다 음수로 잡혀, 수렴하는 걸로 결론.
ANOVA:
- main-effect:
  - block( $F (3297) = 23.09$ , $p < 0.001$ )
  - vowel( $F (4396) = 7.61$ , $p < 0.001$ )
- 2-way interaction:
  - vowel x block( $F (121, 188) = 2.07$ , $p < 0.01$ )
  - vowel x gender( $F (4, 396) = 3.4$ , $p < 0.01$ )
- 3-way:
  - voice(race) x vowel x block ( $F (121, 188) = 2.03, p < 0.05$ )
  - gender x block x vowel ( $F (121, 188) = 2.64, p < 0.01$ )
- 4-way:
  - visual prompt x voice x block x vowel ( $F (121, 188) = 2.2, p < 0.01$ )
- 5-way:
  - visual prompt x voice x gender x block x vowel ( $F (121, 188) = 2.98, p < 0.001$ )
전반적으로 참가자들은 모델 화자의 모음 스펙트럼에 가까워지는 음성 모방 현상을 보였습니다(음향적 거리가 유의하게 감소).
모음별, 블록별, 그리고 조건에 따라 모방의 정도가 달라졌으며, 특히 시각적 단서가 제공된 조건에서 모방 효과가 강화되었습니다.
또한, 참가자 성별과 모델 화자의 인종에 따른 상호작용 효과가 관찰되어, 예를 들어 여성 참가자는 /æ/ 모음을, 남성 참가자는 경우에 따라 다른 모음을 더 많이 모방하는 경향이 있었습니다.

Discussion

연구 결과는 음성 모방이 단순히 자동적으로 발생하는 것이 아니라, 음향적 여유(예: 모음의 차이)와 사회적 요인(시각적 단서, 호감도, 성별 등)에 의해 조절된다는 점을 보여줍니다.
사회적 맥락, 특히 모델 화자의 시각적 단서가 제공될 경우 모방이 더욱 촉진됨을 확인하였으며, 이는 CAT와 같은 사회언어학적 이론과 일치합니다.
또한, 노출 횟수가 누적 효과를 보이지 않는다는 점은, 모방이 단순한 반복 노출의 결과만은 아니라는 점을 시사하며, 인지적/사회적 요인이 복합적으로 작용함을 암시합니다.
이 연구는 자발적 음성 모방이 음성 생산의 미세한 조정에 기여하며, 이는 장기적인 방언 변화나 스타일 전환의 기초가 될 수 있음을 시사합니다.

Juhyeon's Blog

탐색기

Evidence for phonetic and social selectivity in spontaneous phonetic imitation

Introduction

Methods

Procedure

Results & Analysis

Metric

Analysis

Results

Discussion

그래프 뷰

목차

Properties

백링크