研究課題/領域番号 |
26284062
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
前川 喜久雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (20173693)
|
研究分担者 |
森 大毅 宇都宮大学, 工学(系)研究科(研究院), 准教授 (10302184)
Rose Ralph 早稲田大学, 理工学術院, 准教授 (30404916)
河原 英紀 和歌山大学, 学内共同利用施設等, 名誉教授 (40294300)
渡辺 美知子 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 研究員 (60470027)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | フィラー / コーパス / 自発音声 / 声質 / 日本語 / 英語 / 中国語 |
研究実績の概要 |
初年度に引き続いて、日本語、英語、中国語のフィラーの音声学的な分析を実施した。日本語については、初年度にフィラーと通常の語彙項目中の母音との間には種々の音声学的な差が存在することを確認できたので、そのうちどの特徴がフィラーと通常の語彙項目の判別に重要であるかを機械学習の手法を用いて検討した。手法としてはランダムフォレストを利用した場合、後者の方が精度の高いモデルを構築できることがわかった。初年度に実施した音響分析結果を利用することで、交差検定で9割前後の高い正答率を得られることが判明した。 また上記の分析を発展させた課題として、コーパスに発声様式(phonation type)の情報を自動付与するための研究に着手し、機械学習に利用するための正解データを作成した。 英語については、音響分析を継続したことにくわえ、『日本語話し言葉コーパス』の模擬講演データと比較可能な英語の模擬講演データを作成し、分析した。予備的な分析結果は、日本語の発話は英語よりもフィラーが多いという従来の定説を覆す結果を示しており、大変興味深いものであった。 中国語に関しては、フィラーのピッチ特性を分析を継続したほか、分節音の音響特徴に関する分析を開始した。 2015年8月に英国で開催された言語の非流暢性に関する国際会議(Disfluency in Spontaneous Speech 2015)で3件の研究発表を行なった。研究代表者は分科会の司会もおこなった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度末に計画をたてた声質の機械学習に関する研究に予定通り着手し、予備的な分析を行なうことができた。『日本語話し言葉コーパス』と比較可能な英語コーパスは当初予定よりお早期に構築することができた。一方、新しいピッチ抽出法に関する研究は、現在も試行錯誤の段階にある。
|
今後の研究の推進方策 |
今年度は、1)声質の機械学習に関する研究を進める、2)フィラーの頻度に関する日英比較を進める、3)新しいピッチ抽出法の検討を進める。また、これらの研究について国際学会等で発表する。研究の最終年度にあたっての措置として、8月に台湾で非公開の研究打合せをおこなった後、12月には東京で公開ワークショップを開催して研究成果を一般に報告する予定である。
|
次年度使用額が生じた理由 |
初年度に音響分析の自動化に成功したことにより、アルバイト謝金の一部が不要になり、作業用PCの購入も不用になったこと、また研究計画を立案した2014年には予測できなかったスピードで、機械学習のためのフリーウェアが普及したことにより、プログラム開発、ソフトウェア購入費用の一部が不用となったことによる。
|
次年度使用額の使用計画 |
老朽化したPCのリプレース費用にあてる。また、機械学習用データを当初予定より拡張して作成する費用にあてる。
|