• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

方言音声のビデオアーカイブ化と方言音声理解のための情報処理技術の確立

Research Project

Project/Area Number 18K11358
Research InstitutionIwate Prefectural University

Principal Investigator

伊藤 慶明  岩手県立大学, ソフトウェア情報学部, 教授 (90325928)

Co-Investigator(Kenkyū-buntansha) 李 時旭  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)
松原 雅文  岩手県立大学, ソフトウェア情報学部, 准教授 (70363728)
Project Period (FY) 2018-04-01 – 2021-03-31
Keywords方言音声処理 / 音声中の検索語検出 / 音声認識 / 深層学習
Outline of Annual Research Achievements

本研究課題では、現在の語り部による民話の収録を新たに行い、遠野方言・民話保存活動に関する地域貢献を果たすことと、標準語とは音素体系が異なる方言音声に対して検索技術を確立すること、また、一般の人が遠野方言の民話を聞いても理解できるように語りの理解をサポートする技術を確立すること、これらを目的として、2018年度は以下の研究開発を実施した。
① 方言音声の収録:遠野文化研究センターおよび遠野昔話語り部の会と協力して、遠野地方の語り部が話す民話のビデオ収録を開始し、現段階で10人約10時間の方言音声を含むビデオデータが構築できた。遠野方言・民話保存活動を進めている遠野地域への地域貢献を果たすことができた。
② 方言音声の検索システムの研究開発:方言には辞書やテキストで記述されたデータがなく、単語をベースとした音声認識システムを利用できない。標準語の音声認識システムの音素体系・単語体系が異なる方言音声に対して、既に研究開発を行っている語彙に依存しない音声検索システムの応用を図った。音声認識システムの音響的特徴モデルと方言の音響的特徴とは異なるため、最新の深層学習モデルを方言音声に適用した。まずは、方言音声の情報処理技術の確立の第一歩として、語り部が話している民話中のキーワードに対し検索・検出を可能にするシステムの研究開発を行った。また、方言音声の検索に、キーワードをテキストあるいは音声で与えた場合の検索方式の検討を行い、検索に適切な音声言語単位を評価した。
その結果、音声で検索キーワードを与える場合よりもテキストで検索キーワードを与える方が高い検索精度が得られること、また、テキストで検索する場合、音声データを処理する言語単位を単語、音節等があるが、これらを複数並列して用いて検索し、結果を統合することでより高い精度が得られることを研究開発した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究課題は、以下3つのサブテーマから構成されている。
① 方言音声の収録、② 方言音声の検索システムの研究開発、③方言理解サポートシステムの研究開発:
2018年度は予定通り主に①の方言音声の収録および②の方言音声の検索システムの研究開発を中心に進めた。①の方言音声の収録については当初20人の語り部に対して20時間の収録を目標としていたが、本年度でほぼ半数を実施することができ、計画通りである。そのデータの一部については既に、遠野市の文化研究センターおよび遠野昔話語り部の会に提供し、地域貢献を果たした。
②の方言音声の検索システムの研究開発については、③の方言理解サポートシステムに繋げるため、高精度・リアルタイムでの検索を実現すべく、検索キーワードをどのように(音声・テキスト)で与えるべきかの検討をかさね、2018年度は研究実績の概要で述べたように様々な知見が得られ、今後の方向性を示すことができた。本サブテーマについてもおおむね計画通りの進捗状況にある。

Strategy for Future Research Activity

今後の研究の推進方策は、本研究課題を構成する3つのサブテーマについてそれぞれ以下の通りである。
① 方言音声の収録:引き続き遠野文化研究センターおよび遠野昔話語り部の会と協力して、遠野地方の語り部が話す民話の収録を継続し、2019年度はトータル20人各10話程度ずつ約20時間のビデオデータの構築を目指すとともに、先行して研究した芸術家の技術伝承のためのビデオアーカイブ化技術を生かして、遠野方言・民話保存のアーカイブ化を推進し、地域貢献を果たすとともに、音声言語処理の研究用のデータとして提供・利用可能性を検討していく。
③方言理解サポートシステムの研究開発:方言で民話が話されている最中に、その民話を標準語化した字幕を表示しても、民話の温かさが失われ望ましくない。一方、聞き手が分からないキーワードがその場でその意味を聞き手に提供できれば、聞き手は民話の内容を理解しやすくなる。そこで本研究課題では、②の方言検索システムを拡張し、民話の重要キーワードをスポッティング的に検出し、リアルタイムに聞き手の理解を支援するシステムの構築を目標としている。2019年度はそのフィージビリティスタディ(どのタイミングで・どのようにキーワード情報を提供すれば理解のサポートになるか等)を実施する。

  • Research Products

    (7 results)

All 2018

All Presentation (7 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] Empirical Analysis of Score Fusion Application to Combined Neural Networks for Open Vocabulary Spoken Term Detection2018

    • Author(s)
      Shi-wook Lee, Kazuyo Tanaka and Yoshiaki Itoh
    • Organizer
      INTERSPEECH 2019
    • Int'l Joint Research
  • [Presentation] 音声中の検出語検出におけるWeb検索とWord Vectorを用いたリスコアリング方式2018

    • Author(s)
      丹治遥,小嶋和徳,李時旭,南條浩輝,伊藤慶明
    • Organizer
      情報処理学会研究報告
  • [Presentation] 音声中の検出語検出におけるドキュメントの最尤系列化と上位候補の再照合による検索時間・精度の改善2018

    • Author(s)
      金子大祐,小嶋和徳,李時旭,伊藤慶明
    • Organizer
      情報処理学会研究報告
  • [Presentation] 音声中の検索語検出における深層学習の事後確率を用いたクエリの最尤系列化方式,2018

    • Author(s)
      岩﨑 瑛太郎,小原 真人,小嶋 和徳,李 時旭,伊藤 慶明
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 遠野物語方言音声の収録とその理解システムの検討2018

    • Author(s)
      飯田 英仁,小嶋 和徳,李 時旭,伊藤 慶明
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 音声中の検索語検出における深層学習を用いた最尤系列の最適化による検索精度の向上2018

    • Author(s)
      岩﨑 瑛太郎,川村 朋輝,小嶋 和徳,李 時旭,伊藤 慶明
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 音声中の検索語検出におけるドキュメント最尤系列化と複数の機械学習モデルによる検索時間・精度の改善2018

    • Author(s)
      金子 大祐,小嶋 和徳,李 時旭,伊藤 慶明
    • Organizer
      日本音響学会春季研究発表会

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi