• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

リアルタイムMRI動画による日本語調音運動データベースの構築と公開

研究課題

研究課題/領域番号 20H01265
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分02060:言語学関連
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

前川 喜久雄  大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 所長 (20173693)

研究分担者 定藤 規弘  生理学研究所, 脳機能計測・支援センター, 教授(兼任) (00273003)
斎藤 純男  拓殖大学, 外国語学部, 教授 (10225740)
籠宮 隆之  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, プロジェクト非常勤研究員 (10528269)
竹本 浩典  千葉工業大学, 先進工学部, 教授 (40374102)
石本 祐一  ものつくり大学, 技能工芸学部, 准教授 (50409786)
吉永 司  豊橋技術科学大学, 工学(系)研究科(研究院), 助教 (50824190)
北村 達也  甲南大学, 知能情報学部, 教授 (60293594)
菊池 英明  早稲田大学, 人間科学学術院, 教授 (70308261)
桂田 浩一  東京理科大学, 理工学部情報科学科, 教授 (80324490)
小林 哲則  早稲田大学, 理工学術院, 教授 (30162001)
西川 賢哉  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (50780516)
研究期間 (年度) 2020-04-01 – 2024-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2021年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2020年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
キーワードリアルタイムMRI / データベース / 調音運動 / 日本語 / 音声学 / 調音音声学 / 音声合成 / モンゴル語
研究開始時の研究の概要

本研究は医療用MRI装置でリアルタイム撮像された大量の日本語調音運動データをその検索環境とともに一般公開することによって、日本語調音音声学の未解明問題について広くオープンな議論を行うための研究インフラを提供しようとするものである。
リアルタイムMRI動画には声道の全体形状が高解像度で記録されている。わけても従来可視化がほぼ不可能であった軟口蓋から咽頭を経て喉頭に到る声道後部が鮮明に観察できる点は、音声研究史上画期的であり、音声学者・音声生成研究者の永年の夢を実現したデータである。外国人に対する日本語音声教育教材としても高い価値が認められる。

研究実績の概要

本研究の主要な目標であるリアルタイムMRI撮像技術による日本語の調音運動データベースは「リアルタイムMRI調音運動データベース」第1版としてウェブ上でのデータ検索を可能にした(https://rtmridb.ninjal.ac.jp/)。1年前に公開した試験公開版と比較すると話者数は10名から22名に増えて当初目標を達成するとともに、音声に重畳して収録されていたMRI装置の稼働ノイズをデジタル音声処理によってほぼ消去することに成功している。さらに上記ウェブサイトで検索対象としている動画データを国立情報学研究所の音声言語コンソーシアムから公開した。以上によって音声研究のインフラ整備に関する当初目的は達成済みとなった。ウェブ版はこれまでに1000名以上の異なりユーザーによって利用されており、そのうち1割程度がリピーターである。
データベースの公開作業以外には、近い将来におけるデータベースのバージョンアップを念頭において、①これまでに開発してきた音声器官輪郭抽出技術の効率化と、②MRI画像には映らないが音声研究上重要な門歯の形状を推定してMRI動画中に埋め込む手法に関する技術開発を行い、いずれも実用レベルの技術を開発することができた。またリアルタイムMRI動画からの音声合成技術についても研究を進めて、自然性の高い音声の合成に成功した。
そのほかにはモンゴル語母音調和に関する知覚実験を実施した。また音声合成研究のために音素バランス文である「ATR503文」のリアルタイムMRIデータ収録を開始した。これは合成音声の品質向上のために必要とされるものであるが同時に連続音声に生じる調音結合現象の音声学的分析のためにも利用する予定である。これまでに男女各2名のデータを収録し、データ公開に必要とされる知財関係の処理を終了した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

研究計画申請時に主要な目標として記載した話者21名分のリアルタイムMRI調音運動データベースを1年先倒しで公開することができた。特殊なデータであるにもかかわらず、異なり人数で1000名以上の訪問者があり、そのうち1割程度がリピーターとしてデータを繰り返し利用している。日本以外に米国、中国、台湾、韓国、ドイツなどの国にユーザーが多い。またリアルタイムMRIデータから調音運動を計測するためのデータブラウジング環境もgithub上で公開している。
その他、当初計画に記載した音声器官輪郭の自動抽出技術も確立することができた。さらに当初計画では挑戦的な応用課題として記載していたリアルタイムMRIデータからの音声合成(MRI to Speech)に関しても自然性の高い音声の合成に成功した。
本研究の成果は国際学会での発表を経て、複数の国際的に著名な査読論文誌(Journal of Acoustical Society of America, Journal of International Phonetic Association)に採録されている。前者はマスコミで報道されて反響をよんだ、後者はWikipedia英語版の日本語音声のページの参考文献として記載されている。

今後の研究の推進方策

最終年度には歯列データを埋め込んだ動画を作成する予定であるが、これを最終年度中に公開するかどうかは検討中である。できればウェブ上では検索可能にしたい。
現在公開しているデータは単独モーラ、バイモーラ、孤立単語など、実験的性格の強い発話であるが、2022年度から収録を開始した「ATR503文」データは、より自然な連続発話のデータであり、音声合成のために従来より広い音韻環境をカバーしている。このデータも将来的な一般公開を念頭においてデータ整備を進めるが、本研究期間内の公開は想定していない。特に音響的な音素セグメンテーション情報と結合することによって、調音運動データと音響データの相互参照が可能なデータベースの実現をめざす。
音声合成に関しては、既にかなりの達成をみたMRI to Speechからさらに一歩進んだ目標としてText to MRIの実現を試みる。つまり音素列を与えると調音運動の動画が生成されるシステムの研究である。
音声学に関しては、現在公開済みのデータを活用して、日本語調音音声学の全面的な見直しを進める。これまでに、撥音、ワ行子音、「ヒ」と「シ」の子音の比較についての分析を公開しており、ラ行子音、ハ行子音、ダ行子音についての分析が進行中である。将来的にはこれらの成果を一冊の著作にまとめて公刊することを想定している。

報告書

(3件)
  • 2022 実績報告書
  • 2021 実績報告書
  • 2020 実績報告書
  • 研究成果

    (28件)

すべて 2023 2022 2021 2020 その他

すべて 国際共同研究 (1件) 雑誌論文 (4件) (うち査読あり 3件、 オープンアクセス 4件) 学会発表 (18件) (うち招待講演 3件) 図書 (1件) 備考 (4件)

  • [国際共同研究] 内蒙古大学(中国)

    • 関連する報告書
      2022 実績報告書
  • [雑誌論文] Variability in Production of Non-Sibilant Fricative [h] in /hi/2022

    • 著者名/発表者名
      Tsukasa Yoshinaga, Kikuo Maekawa, and Akiyoshi Iida
    • 雑誌名

      Proceedings INTERSPEECH 2022

      巻: 1 ページ: 620-624

    • DOI

      10.21437/interspeech.2022-303

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Aeroacoustic differences between the Japanese fricatives [s] and [h]2021

    • 著者名/発表者名
      Yoshinaga Tsukasa、Maekawa Kikuo、Iida Akiyoshi
    • 雑誌名

      The Journal of the Acoustical Society of America

      巻: 149 号: 4 ページ: 2426-2436

    • DOI

      10.1121/10.0003936

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Production of the utterance-final moraic nasal in Japanese: A real-time MRI study2021

    • 著者名/発表者名
      Kikuo Maekawa
    • 雑誌名

      Journal of the International Phonetic Association

      巻: 51 号: 1 ページ: 1-24

    • DOI

      10.1017/s0025100321000050

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Remarks on Japanese /w/2020

    • 著者名/発表者名
      Kikuo Maekawa
    • 雑誌名

      ICUWPL

      巻: 10 ページ: 45-52

    • DOI

      10.34577/00004625

    • NAID

      120006812170

    • ISSN
      24333883
    • URL

      https://icu.repo.nii.ac.jp/records/4799

    • 年月日
      2020-03-06
    • 関連する報告書
      2020 実績報告書
    • オープンアクセス
  • [学会発表] 頭頸部の正中矢状面におけるrtMRI動画への歯列補填2023

    • 著者名/発表者名
      常盤 朔也,一岡 昴輝,大谷 幸聖,竹本 浩典,前川 喜久雄
    • 学会等名
      日本音響学会第149回(2023年春季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 日本語標準語話者の正中面における子音/s/の声道形状の分析2023

    • 著者名/発表者名
      藤澤 流以,天野 沢海,竹本 浩典,前川 喜久雄
    • 学会等名
      日本音響学会第149回(2023年春季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 調音音声学のこれから2022

    • 著者名/発表者名
      前川喜久雄
    • 学会等名
      日本音声学会第36回全国大会特別講演
    • 関連する報告書
      2022 実績報告書
    • 招待講演
  • [学会発表] 声道断面積関数の操作によるモンゴル語母音音韻特徴の検討2022

    • 著者名/発表者名
      加地 優太,竹本 浩典,斎藤 純男,玉栄,前川 喜久雄
    • 学会等名
      日本音響学会第148回(2022年秋季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 日本語話者10名の正中面における/k/の声道形状の分析2022

    • 著者名/発表者名
      天野 沢海,藤澤 流以,竹本 浩典,北村 達也,能田 由紀子,前川 喜久雄
    • 学会等名
      日本音響学会第148回(2022年秋季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 2段階モデルによるrtMRI動画からの輪郭抽出2022

    • 著者名/発表者名
      藤澤 流以,堀井 千陽,天野 沢海,竹本 浩典,北村 達也,能田 由紀子,前川 喜久雄
    • 学会等名
      日本音響学会第148回(2022年秋季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 明示的な音声特徴量に基づくDNN音声合成2022

    • 著者名/発表者名
      後藤 仁,小澤 凜夏,竹本 浩典,平井 啓之,前川 喜久雄
    • 学会等名
      日本音響学会第148回(2022年秋季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 磁気センサシステムによる調音運動計測のための口蓋・咬合面の計測法2022

    • 著者名/発表者名
      能田 由紀子,北村 達也,竹本 浩典,前川 喜久雄
    • 学会等名
      日本音響学会第148回(2022年秋季)研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] モンゴル語の母音生成時の声道断面積関数の分析2022

    • 著者名/発表者名
      加地 優太,竹本 浩典,斎藤 純男,前川 喜久雄
    • 学会等名
      日本音響学会(2022年春季)研究発表会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 日本語話者10名の正中面における母音声道形状の分析2022

    • 著者名/発表者名
      天野 沢海,竹本 浩典,北村 達也,能田 由紀子,前川 喜久雄
    • 学会等名
      日本音響学会(2022年春季)研究発表会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 隣接子音が母音声道形状に及ぼす影響の分析2022

    • 著者名/発表者名
      天野 沢海,後藤 翼,竹本 浩典,北村 達也,能田 由紀子,前川 喜久雄
    • 学会等名
      日本音響学会(2022年春季)研究発表会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 条件異音再考2022

    • 著者名/発表者名
      前川喜久雄
    • 学会等名
      日本音響学会音声コミュニケーション研究会
    • 関連する報告書
      2021 実績報告書
    • 招待講演
  • [学会発表] リアルタイムMRI動画データベースプロジェクトの概要と調音音声学への応用2021

    • 著者名/発表者名
      前川喜久雄
    • 学会等名
      言語資源活用ワークショップ2021
    • 関連する報告書
      2021 実績報告書
    • 招待講演
  • [学会発表] リアルタイムMRI調音動画データの閲覧および解析環境の開発2021

    • 著者名/発表者名
      浅井拓也・菊池英明・前川喜久雄
    • 学会等名
      言語資源活用ワークショップ2021
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 日本語話者 20 名の rtMRI 動画における発話器官の輪郭抽出2021

    • 著者名/発表者名
      天野沢海,並木崇宏,宮川翔多,後藤翼,竹本浩典,北村達也,能田由紀子,前川喜久雄
    • 学会等名
      日本音響学会2021年春季研究発表会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] EMA による調音運動観測のための咬合面と口蓋の計測法2021

    • 著者名/発表者名
      能田由紀子,北村達也,浅井拓也,竹本浩典,前川喜久雄
    • 学会等名
      日本音響学会2021年春季研究発表会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] rtMRI 動画から抽出した発話器官の輪郭データに基づく平均声道の生成と分析2020

    • 著者名/発表者名
      後藤翼,天野沢海,竹本浩典,北村達也,能田由紀子,前川喜久雄
    • 学会等名
      日本音響学会2020年秋季研究発表会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] リアルタイムMRI動画日本語調音運動データベースの設計2020

    • 著者名/発表者名
      前川喜久雄, 西川賢哉, 浅井拓也, 能田由紀子, 正木信夫, 島田育廣, 竹本浩典, 北村達也, 斎藤純男, 籠宮隆之, 石本祐一, 菊池英明, 藤本雅子, 八木豊
    • 学会等名
      言語資源活用ワークショップ2020
    • 関連する報告書
      2020 実績報告書
  • [図書] 東京外国語大学国際日本学研究報告X2020

    • 著者名/発表者名
      前川喜久雄
    • 総ページ数
      81
    • 出版者
      東京外国語大学国際日本学研究院
    • 関連する報告書
      2020 実績報告書
  • [備考] The real-time MRI articulatory movement database

    • URL

      https://rtmridb.ninjal.ac.jp/

    • 関連する報告書
      2022 実績報告書
  • [備考] 31. リアルタイムMRI調音運動データベース 第1版 (rtMRIDB)

    • URL

      http://research.nii.ac.jp/src//rtMRIDB.html

    • 関連する報告書
      2022 実績報告書
  • [備考] リアルタイムMRI動画を用いた調音音声学の再構築―ワ行子音の問題―

    • URL

      https://www.youtube.com/watch?v=YcIN8CoHmqk

    • 関連する報告書
      2022 実績報告書
  • [備考] The real-time MRI articulatory movement database

    • URL

      https://rtmridb.ninjal.ac.jp

    • 関連する報告書
      2020 実績報告書

URL: 

公開日: 2020-04-28   更新日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi