2021 Fiscal Year Annual Research Report
Real-time MRI database of articulatory movements of Japanese
Project/Area Number |
20H01265
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
前川 喜久雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (20173693)
|
Co-Investigator(Kenkyū-buntansha) |
定藤 規弘 生理学研究所, システム脳科学研究領域, 教授 (00273003)
斎藤 純男 拓殖大学, 外国語学部, 教授 (10225740)
籠宮 隆之 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変異研究領域, 特任助教 (10528269)
小林 哲則 早稲田大学, 理工学術院, 教授 (30162001)
竹本 浩典 千葉工業大学, 先進工学部, 教授 (40374102)
石本 祐一 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (50409786)
北村 達也 甲南大学, 知能情報学部, 教授 (60293594)
菊池 英明 早稲田大学, 人間科学学術院, 教授 (70308261)
桂田 浩一 東京理科大学, 理工学部情報科学科, 教授 (80324490)
吉永 司 豊橋技術科学大学, 工学(系)研究科(研究院), 助教 (50824190)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | リアルタイムMRI / 調音音声学 / 調音運動 / データベース / 日本語 / モンゴル語 |
Outline of Annual Research Achievements |
本研究の主要目標であるリアルタイムMRI撮像技術による日本語の調音運動データベースについては、2020年末までに収録とアノテーションを完了した話者10名分(男性6名、女性4名による約10000発話)のデータをウェブ上で試験公開した(2023年3月末にVer.1で置換)。これは目標のほぼ半数にあたるデータであり、目標達成の目途がたった。また新たに話者4名分のリアルタイムMRIデータを収録した。 本研究で収集したMRIデータの分析結果は従来国内外の学会で発表を重ねてきたが、2021年には2本の査読論文が国際的に著名な学術誌に掲載された。ひとつはアメリカ音響学会誌に掲載された論文で、東京語などに生じる「ヒ」と「シ」の子音が混同される現象の原因を声道形状と呼気流量による生成実験およびコンピュータシミュレーションによって探った研究である。正中矢状断面における声道形状がほぼ同一であっても、冠状断面方向の声道形状の差によって「ヒ」と「シ」の子音を生成し分けることが可能なことを明らかにした。 もうひとつは国際音声学協会誌に掲載された、日本語の語末撥音の調音に関する論文である。従来、語末の撥音は口蓋垂鼻音であることが定説となっていたが、これは主観的観察に依拠した分析であった。本研究で収集した多数話者の声道形状データは、この定説が成立しておらず、語末の母音はその直前に位置する母音とほぼ同じ位置で調音されていることを明らかにした。 日本語以外の言語についてはモンゴル語の母音調和現象について話者3名分の声道形状の分析をすすめた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
研究計画申請時に目的として記載した話者20名分のリアルタイムMRI調音運動データベースのほぼ50%にあたるデータを4年計画の2年目に公開することができた。 その他、当初計画に記載した音声器官輪郭の自動抽出技術についても高い精度での自動抽出を可能にするための要素技術を確立することができた。 構築したデータベースを用いた研究成果が複数の国際的に著名な査読論文誌(Journal of Acoustical Society of America, Journal of InternationalPhonetic Association)に掲載された。前者はネットニュース(FNNプライムオンライン)で報道され反響を呼んだ。後者はWikipediaのJapanese phonologyとvoiced uvular nasalの記事において参考文献として言及されている。 モンゴル語の母音調和についても声道形状の計測のもとづく生理音声学的な分析を進めることで従来の説明の問題点を明確化することに成功した。
|
Strategy for Future Research Activity |
今後は研究申請時の目標である話者20名分のデータ公開をめざしてアノテーション作業をすすめ、試験公開版ユーザーからのフィードバックに基づいてデータおよび検索系のアップデートをおこなった版を Ver.1として一般公開する予定である。またウェブ版にくわえて、DVD版配布の準備を進める。DVD版は動画データを含むデータベース全体を研究目的で公開するものであり、専門的な音声研究者をユーザーとして想定している。Ver.1にむけての技術的課題としては、MRIでは撮像できないが音声学的には重要な情報源である門歯形状のデータを推定してリアルタイムMRI動画に埋め込む技術の開発、音声に重畳して録音されているMRI装置の稼働ノイズのデジタル処理による軽減のふたつがあげられる。 研究申請時に挑戦的な課題として記載したリアルタイムMRI動画に記録された声道正中断面の画像データから音声を合成する研究(MRI to Speech)にも本格的にとりくむ予定である。ただしこの研究では従来収集してきたデータよりも幅広い範囲の音声環境をカバーする必要が生じるので、必要に応じて音素バランス文の収録を試みることにしたい。 本データベースを用いた音声科学的研究のテーマとしては、計測された声道形状に基づくモンゴル語母音の合成と知覚実験による評価の研究、日本語ラ行子音に関する従来説の批判的検討、多数話者のデータにもとづく平均的声道形状導出の研究などを予定している。
|
Research Products
(8 results)