2018 Fiscal Year Annual Research Report
Elaboration of articulatory phonetics by means of realtime-MRI and WAVE data
Project/Area Number |
17H02339
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
前川 喜久雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (20173693)
|
Co-Investigator(Kenkyū-buntansha) |
斎藤 純男 拓殖大学, 外国語学部, 教授 (10225740)
藤本 雅子 早稲田大学, 人間科学学術院, その他(招聘研究員) (30392541)
竹本 浩典 千葉工業大学, 先進工学部, 教授 (40374102)
北村 達也 甲南大学, 知能情報学部, 教授 (60293594)
菊池 英明 早稲田大学, 人間科学学術院, 教授 (70308261)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | リアルタイムMRI / 調音音声学 / 調音運動 / 音声器官 / 機械学習 / データベース / アノテーション |
Outline of Annual Research Achievements |
リアルタイムMRI動画データベースの素材をえるために、新たに13名分の撮像実験を実施した(標準語10名、近畿方言3名)。実験終了後にはMRI装置が出力するDCM形式データを一般的なmp3動画ファイルに変換し、DATに収録された音声との同期をとった。こうして得られるMp3ファイルの画像情報を音声情報と関連づけながらブラウザ上で自由に視察し、時間情報および空間情報のアノテーションを行うためのウェブアプリを開発し、実用に供した。このウェブアプリを用いて、標準語話者のデータに対して、発話時間情報アノテーションを実施した。また一部のサンプルについては、子音の調音位置情報のアノテーションも実施した。 機械学習によって音声器官(唇・舌・口蓋・咽頭壁・喉頭)の輪郭情報を自動抽出する手法を開発した。同一話者であれば、少数(数十フレーム)のサンプルに対して人手で付与した輪郭データを学習することで、人手作業と同程度の精度が達成できることを確認し、標準語話者1名の全データ(数万フレーム)の自動アノテーションを実施した。 リアルタイムMRIでは仰臥位で発話を行う。姿勢が調音運動におよぼす影響を評価するための実験をWAVE装置を用いて実施した。 日本語の発話末に生じる撥音およびモンゴル語の母音調和についてリアルタイムMRIデータを活用した言語学的な分析を進めた。音声科学分野で評価の高い国際会議であるICPhSに2本の論文が採択された(発表は2019年8月の予定)。その他、日本音響学会、日本音声学会等で口頭発表をおこなった。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初に予定した人数のリアルタイムMRI動画データの収録を終えた。当初は挑戦的課題として位置付けていたMRI画像からの音声器官輪郭抽出技術をほぼ確立することができた。音声科学分野で評価の高い国際会議に2本の論文が採択された。
|
Strategy for Future Research Activity |
最終年度には、若干のデータを追加収録するとともに、これまでに蓄積したデータのデータベース化を進める。できればデータの一部を予備的に公開したい。 一人の話者の調音器官輪郭の教師データを用いて、別の話者の輪郭情報を正確に抽出する技術の開発に挑む。 言語学専攻の大学院でリアルタイムMRIデータの分析に基づく講義を行い、日本語調音音声学上の諸問題の解明に努める。
|
Research Products
(9 results)