発表

一般研究発表(ポスター)
1AM-079

仮想的パーソナリティ印象の創出と音声の韻律的特徴の制御

[責任発表者] 内田 照久:1
1:大学入試センター

目 的
 音声は,言語的情報に留まらず,話者自身の特徴に関わる情報も同時に伝達している。話すリズムやイントネーション,声色の特徴といった音声の韻律的な特徴と,話者の性格印象との関係性が明らかになれば,聞き手が抱く話し手の印象が予測できる。すると,それに応じて話し方を工夫することで,自己表現をより豊かにすることができる。さらに人柄を感じさせる音声の合成に向けた取組みも可能になる。
 これまでに,下記の韻律特徴量と話者の性格印象の関係を,性格特性5因子モデルのBig Fiveを測定のフレームワークに据えて検討してきた (内田, 2000, 2002; 2005a; 2005b, 2011; 2014)。
1. 音声の時間構造: 実音声・休止の継続時間長
 (1) 発話速度の制御: 話すテンポやリズム
 (2) 休止時間の配分: ポーズや息継ぎの間
2. 基本周波数(F0)の軌跡パターン: 声の高さの遷移
 (1) イントネーションの変動幅: 抑揚の大きさ
 (2) イントネーションの輪郭形状: 未知の抑揚
3. スペクトル周波数軸上の声質属性: 声色の特徴
 (1) 母音間の音響コントラスト: 母音の明瞭性
 (2) スペクトル周波数軸の伸縮: 声道長の制御
 その結果,それぞれの韻律的特徴量の単調な変換に対して,性格印象は複雑に変化していた。5つの性格特性の印象変化パターンは単調増加や減少でなく,曲線的な放物線状に変化しており,特性ごとにピーク位置や傾きが異なっていた。
 例えば,外向性や勤勉性の印象は,やや速い発話で評価が高いが,遅い発話では急激に低下する。一方,温和で親切といった協調性は,ややゆっくりした発話で評価が高く,早い発話では逆に評価が下がる特徴が見られた。この結果から,性格印象の全体像は,複雑に変容していることが示された。
 しかし,各特性印象の変化は,いずれも各韻律的特徴量に対して,非線形な回帰予測式で近似できることがわかった。したがって,各特性の予測式で個別に特性値を推定した上で,その5つの特性値を組合せて,話者全体の印象を再構成して表現するという,構造的なモデル化が提案された。
 もしこのモデルが有効ならば,韻律的な特徴量を操作することで,目的に応じた任意の仮想的パーソナリティの印象を生成できることになる。そこで本報告ではその実験を試みる。
方 法
 先行研究のメタ分析を通じて,今回ターゲットとする性格特性を選定した。それぞれの韻律的特徴量ごとに,その量的な違いによって,性格特性間の印象評価のピーク位置がより大きく異なる特性同士をターゲットの候補とした。その結果,Big Fiveからは,“外向性”,“勤勉性”,“協調性”が,擬態語表現による性格特性からは,“緩やかさ”が選ばれた。
 そして,制御する韻律的特徴量としては,メタ分析から,“発話速度”,“イントネーション変動幅”,“イントネーション輪郭形状”,“スペクトル周波数軸伸縮”を採用した。
 試料となる原音声は,ニュース音声の原稿を女性(40代)が発話したものを用いた(Fig.1)。そして,4つのターゲット性格特性について,各々の印象が最も高くなると想定される韻律的特徴ごとの操作量を算定した。そしてTANDEM-STRAIGHT (河原・森勢, 2009)を利用して,4種類の変換音声を生成した。
結 果
 変換音声から想起される話者の印象について,Big Five Scale短縮版と擬態語表現による性格特性尺度(3因子分のみ)を用いた簡易評定を行った。4種の変換音声の評定結果を比較すると,それぞれがターゲットとしている性格特性の評価が,いずれも最も高くなっており,仮想的パーソナリティの印象の制御について,ある程度達成できたと考えられる。
考 察
 現状では,求められる人柄の印象によりいっそう近づけるためのキャリブレーションが不可欠である。
 今後の進展に応じて,目的に応じた仮想的な人柄の印象がコントロール可能になれば,就職活動での面接場面に向けた訓練への応用や,人柄を感じさせる音声合成にも適用できる。さらにそれだけに留まらず,音声からの印象形成や,暗黙裡の性格観のあり方に迫る,新たな切り口としても期待できる。
引 用 文 献
河原英紀・森勢将雅 (2009). TANDEM-STRAIGHTと音声モーフィング:感情音声と歌唱研究への応用 音声研究, 13 (1), 29-39.
西岡美和・小松孝至・向山泰代・酒井恵子 (2006). 性格記述語としての擬態語—語群の構成及び解釈— 心理学研究, 77 (4), 325-332.
内田照久 (2000). 音声の発話速度の制御がピッチ感および話者の性格印象に与える影響 日本音響学会誌, 56 (6), 396-405.
内田照久 (2002). 音声の発話速度が話者の性格印象に与える影響 心理学研究, 73 (2), 131-139.
内田照久 (2005a). 音声の発話速度と休止時間が話者の性格印象と自然なわかりやすさに与える影響 教育心理学研究, 53 (1), 1-13.
内田照久 (2005b). 音声中の抑揚の大きさと変化パターンが話者の性格印象に与える影響 心理学研究, 76 (4), 382-390.
内田照久 (2011). 音声中の母音の明瞭性が話者の性格印象と話し方の評価に与える影響 心理学研究, 82 (5), 433-441.
内田照久 (2014) 声道長の制御を模した声質変換音声の主観印象評価 日本音響学会2014年秋季研究発表会講演論文集, 371-372.

詳細検索
アプリバナー iPhone版,iPad版 Android版