• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

音声処理・言語処理技術を用いた作業記録・手順書作成方式に基づく技術伝承システム

Research Project

Project/Area Number 17H01977
Research InstitutionUniversity of Yamanashi

Principal Investigator

西崎 博光  山梨大学, 大学院総合研究部, 准教授 (40362082)

Co-Investigator(Kenkyū-buntansha) 北岡 教英  豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (10333501)
山本 一公  中部大学, 工学部, 准教授 (40324230)
宇津呂 武仁  筑波大学, システム情報系, 教授 (90263433)
Project Period (FY) 2017-04-01 – 2021-03-31
Keywords音声認識 / ノウハウ・暗黙知 / 技術伝承 / 雑音処理 / ユーザインタフェース / 専門用語認識
Outline of Annual Research Achievements

2020年度の研究実績は次の通りである。
【内容:音声基盤技術の開発】作業記録および手順書作成システムのプロトタイプの被験者による評価実験において,音声認識の低さが大きな問題となっており,引き続き音声認識技術を研究した。低遅延・高精度なリアルタイム音声認識システムの開発と公開,相当大きな雑音でも正確な音声区間が検出できる技術の開発,音認識モデルの精度改善のためのデータ拡張技術を開発した。また,音声認識を専門知識の伝承に用いるにあたって様々な専門用語を認識できるようにする必要があるために,音声認識システムにおける言語モデルに新規語を追加できるトークンを入れて学習することにより,認識時に動的に専門用語を追加できる技術を開発した。加えて,少量の音声で効率的に音響モデルを適応化する手法について引き続いて研究を行った。フィルタバンクにより自動的に特徴抽出を行うFilterbank DNN-HMMのベースにした高齢者話者適応実験を行い,モデル適応の効果があることを確認した。
【内容:言語基盤技術の開発】様々なノウハウサイトに掲載されているノウハウ事例と比較してもより頻繁に発生していると予測される質問と,それに対する回答が多く掲載されているコミュニティQAサイトに着目し,ノウハウ機械読解モデルの適用・評価を行った。
【内容:システムのユーザインタフェースと実証実験】スマートグラス上で作業指示,あるいは作業のヒントが出せるユーザインタフェースを開発した。2020年度はコロナ禍のため多くの研究行動が制限されてしまい,本来なら実証実験を行うところであったが,協力企業等もコンプライアンスの関係で実施ができなかった。ただ,2019年度までは製造業中心の作業を対象としてきたが,2020年度は,ぶどう栽培作業のノウハウを収録しており,このデータを用いて引き続き研究を行う予定である。

Research Progress Status

令和2年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和2年度が最終年度であるため、記入しない。

  • Research Products

    (11 results)

All 2021 2020

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 3 results) Presentation (6 results)

  • [Journal Article] Dynamic out-of-vocabulary word registration to language model for speech recognition2021

    • Author(s)
      Kitaoka Norihide、Chen Bohan、Obashi Yuya
    • Journal Title

      EURASIP Journal on Audio, Speech, and Music Processing

      Volume: 2021 Pages: 1-8

    • DOI

      10.1186/s13636-020-00193-1

    • Peer Reviewed / Open Access
  • [Journal Article] Analysis of Bit Sequence Representation for Sound Classification2020

    • Author(s)
      Yikang Wang, Masaki Okawa, Hiromitsu Nishizaki
    • Journal Title

      Proceedings of the 12th Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2020

      Volume: - Pages: 621-626

    • Peer Reviewed / Open Access
  • [Journal Article] Development of a Low-Latency and Real-Time Automatic Speech Recognition System2020

    • Author(s)
      Leow Chee Siang、Hayakawa Tomoaki、Nishizaki Hiromitsu、Kitaoka Norihide
    • Journal Title

      Proceedings of the 2020 IEEE 9th Global Conference on Consumer Electronics

      Volume: - Pages: 464-467

    • DOI

      10.1109/GCCE50665.2020.9291818

    • Peer Reviewed
  • [Journal Article] ExKaldi: A Python-based Extension Tool of Kaldi2020

    • Author(s)
      Wang Yu、Leow Chee Siang、Nishizaki Hiromitsu、Kobayashi Akio、Utsuro Takehito
    • Journal Title

      Proceedings of the 2020 IEEE 9th Global Conference on Consumer Electronics

      Volume: - Pages: 470-473

    • DOI

      10.1109/GCCE50665.2020.9291717

    • Peer Reviewed
  • [Journal Article] Improving Speech Recognition for the Elderly: A New Corpus of Elderly Japanese Speech and Investigation of Acoustic Modeling for Speech Recognition2020

    • Author(s)
      Meiko Fukuda, Hiromitsu Nishizaki, Yurie Iribe, Ryota Nishimura, Norihide Kitaoka
    • Journal Title

      Proceedings of the 12th Language Resources and Evaluation Conference

      Volume: - Pages: 6578-6585

    • Peer Reviewed / Open Access
  • [Presentation] コミュニティQA サイト上の質問回答事例に対す るノウハウ読解2021

    • Author(s)
      李廷軒, 白書霆, 鈴木勢至, 宇津呂武仁, 河田容英
    • Organizer
      第 35 回人工知能学会全国大会論文集
  • [Presentation] 単語分類タスクにおける時間領域特徴量と周波数領域特徴量の組み合わせ2021

    • Author(s)
      王イ康,大川正暉,西崎博光
    • Organizer
      日本音響学会2021年春季研究発表会講演論文集
  • [Presentation] 超高齢者音声コーパスEARSの構築と音声認識への利用の予備検討2020

    • Author(s)
      芽衣子,入部百合絵,西崎博光,山本一公,西村良太,北岡教英
    • Organizer
      情報処理学会研究報告,音声言語情報処理
  • [Presentation] End-to-End複数言語音声認識モデルにおける様々なマルチタスク学習の検討2020

    • Author(s)
      早川友瑛,西崎博光,山本一公,小林彰夫,宇津呂武仁
    • Organizer
      日本音響学会 2020年秋季研究発表会講演論文集
  • [Presentation] Kaldiベースの低遅延リアルタイム音声認識システムの開発と評価2020

    • Author(s)
      レオ チーシャン,早川友瑛,西崎博光,北岡教英
    • Organizer
      日本音響学会 2020年秋季研究発表会講演論文集
  • [Presentation] CTCを用いた複数の音声認識結果からの高精度な音素列推定2020

    • Author(s)
      李暁陽,西崎博光,小林彰夫,宇津呂武仁
    • Organizer
      日本音響学会 2020年秋季研究発表会講演論文集

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi