2017 年度実績報告書

音声処理・言語処理技術を用いた作業記録・手順書作成方式に基づく技術伝承システム

研究課題

研究課題/領域番号	17H01977
研究機関	山梨大学
研究代表者	西崎博光山梨大学, 大学院総合研究部, 准教授 (40362082)
研究分担者	北岡教英徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10333501) 山本一公中部大学, 工学部, 准教授 (40324230) 宇津呂武仁筑波大学, システム情報系, 教授 (90263433)
研究期間 (年度)	2017-04-01 – 2021-03-31
キーワード	教育工学 / 音声等認識 / ユーザインタフェース / 情報システム / 高齢者音声認識 / 雑音 / 話題集約
研究実績の概要	製造業等において，映像と音声で収録した作業手順を記録し，そこから作業の手順書作成までを支援する技術伝承システムの開発を目的とする。平成29年度には以下の研究内容を実施した。【内容１】システムのプロトタイプを開発した。技術者の持つ暗黙知を引き出し記録する必要があるため，技術者に目線カメラとマイクを装着し，作業の様子を動画と音声で収録する方法を採用した。作業しながらであれば，技術者の持つ暗黙知を言語化しやすいと考えたためである。動画を登録すると音声認識が実行され，動画と音声認識情報がデータベースに登録される。資料の作成は，動画を見ながら必要なシーンを画面キャプチャし，デジタルペン等でメモ文を追加することで行なう。本システムをユーザ評価したところ，特に使いやすさの項目で高い評価（5点満点中4.0）を得た。【内容２】熟練技術者は高齢者が多いため高齢者向け音声認識技術を研究した。そのため，ほとんど収集例のない80歳を超える世代の音声を収集し音声データベースを構築した。これを利用した音声認識システムを構築したが，十分な音声認識性能は得られず，高齢者音声認識の困難さが明確になり，これに対処する研究開発が急務であることが示唆された。また，音声認識精度を向上させる別の手法として，深層学習を用いて音響特徴量を自動抽出する音声認識手法に対して話者適応化を適用することで，音声認識精度を改善する研究を行なった。その結果，提案手法は比較的適応データが少量の場合でも認識精度を改善できるという結果が得られた。【内容３】作業内容（音声認識結果）を分類するための基礎研究を行った。Web検索のサジェスト機能を用いて検索したウェブページ集合に対してトピックモデルを適用することにより，話題の集約を行う方法を開発した。収集したウェブページ集合全体の話題集約を行った結果に対し，より粒度の細かい話題集約方式を実現した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由平成29年度の最大の実施予定項目であった，プロトタイプシステムの開発に関しては，想定していた以上に開発が進み，被験者実験でも，プロトタイプにもかかわらず高い評価を得ることができ，対外発表を実施することができた。音声認識技術の開発については，話者適応化技術を応用する方法を開発することで，認識精度が改善できることを示した。これについても国内学会での発表，国際会議での発表（2018年4月発表済），英語論文誌への投稿を済ませている。加えて，高齢者データベースの構築・整備も実施した。これについても，国際会議（2018年5月発表済）で発表を済ませている。また，話題分類についても，トピックモデルを用いた話題集約手法を開発し，成果を学会発表している。しかし，一方で，順調通りに進んでいない項目も存在する。例えば，雑音環境下での音声認識が想定より困難であることが分かった。本研究では，製造業の工場内での収録を想定しており，実際の環境では機械音がとても大きく，想定していた以上に音声認識がかなり難しいタスクであった。そのため新しい雑音対策方法を考案しなければならない。また，高齢者音声認識も想定以上に困難であった。この理由を考察した結果，例えば発話スタイルの不一致，音響モデルの学習データ量不足などの理由が考えられるため，平成30年度はこれらの課題を解決する方法を研究する。このように，項目によっては計画以上に進捗しているものと，遅れているものがある。全体的に見れば，成果を確実に対外発表・論文投稿できていることから，おおむね順調に進展しているものと考えている。
今後の研究の推進方策	平成30年度は項目１および項目２，項目３，項目４を実施する。【項目１】平成29年度に作業記録および手順書作成システムのプロトタイプシステムを構築した。被験者実験により一部の項目で高い評価を得たものの，改良の余地があることが明らかとなったため，被験者実験で得た知見を中心に，さらにシステムの改良を進める計画である。技術者が使いやすい工夫や暗黙知を引き出す工夫を考案し，ユーザインタフェース上に施すことでシステムを改良していく。【項目２】平成29年度に，雑音除去の方法としてデノイジングオートエンコーダの開発を行ったが，音声認識の大きな改善が得られなかったため，得られる雑音が既知という情報を用いると雑音除去をより高精度にできると考え，これをを開発する。また，平成29年度の研究成果では高齢者の音声認識がかなり困難であることが明らかとなった（音声認識率で約60％）。したがって，高齢者の音声認識のための要素技術の研究を，分担者（北岡・山本）を中心に取り組む。加えて，開発した特定の語句を発話している箇所を特定する技術をシステムに実装することで，資料作成の半自動化を目指す。【項目３】最終的には作業内容（音声認識結果）全体を分類することで類似作業をクラスタリングし，作業の体系化を行うことで手順書作成の支援を目指している。これを実現するための基盤技術として，平成29年度に開発した技術さらに改良する方法を考案することで，引き続きトピック分類基礎技術の研究開発を行う。また，収録されたコンテンツにたいして効率の良いデータアクセス技術も必要であることから，情報アクセスの基盤技術の開発も行う。【項目４】開発した各要素技術は，国内外の音声・言語処理関連の学会で逐次発表する。

研究成果
(23件)

すべて 2018 2017 その他

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (19件) (うち国際学会 10件、招待講演 1件) 図書 (1件) 備考 (2件)

[雑誌論文] 音声認識にむけた超高齢者音声のコーパス構築2017
- 著者名/発表者名
  入部百合絵，北岡教英
- 雑誌名
  
  日本音響学会誌
  
  巻: 73 ページ: 303-310
- 査読あり
[学会発表] 技術伝承のための作業記録の作成・閲覧支援システムの開発2018
- 著者名/発表者名
  西崎博光，Leow Chee Siang
- 学会等名
  平成29年度山梨大学COC事業成果報告会
[学会発表] 複数言語を同時に扱える音声認識のための音響モデリングの検討2018
- 著者名/発表者名
  原翔吾，西崎博光
- 学会等名
  日本音響学会2018年春季研究発表会
[学会発表] Robust lecture speech translation for speech misrecognition and its rescoring effect from multiple candidates2018
- 著者名/発表者名
  Koya Sahashi, Norioki Goto, Hiroshi Seki, Kazumasa Yamamoto, Tomoyoshi Akiba, Seiichi Nakagawa
- 学会等名
  The 4th International Conference on Advance Informatics: Concepts, Theory and Applications
- 国際学会
[学会発表] トピックモデル・分散表現の併用によるウェブ検索結果話題集約におけるサブトピック化2018
- 著者名/発表者名
  丁易，川畑修人，宇津呂武仁，河田容英
- 学会等名
  第10回データ工学と情報マネジメントに関するフォーラム
[学会発表] トピックモデルおよび分類器学習を用いたノウハウサイトの同定2018
- 著者名/発表者名
  李佳奇，林友超，丁易，川畑修人，宇津呂武仁，河田容英
- 学会等名
  第10回データ工学と情報マネジメントに関するフォーラム
[学会発表] 高齢者音声の収録・分析・認識2017
- 著者名/発表者名
  北岡教英，入部百合絵
- 学会等名
  音声資源活用シンポジウム
- 招待講演
[学会発表] Acoustic modeling with a shared phoneme set for multilingual speech recognition without code-switching,2017
- 著者名/発表者名
  Shogo Hara, Hiromitsu Nishizaki
- 学会等名
  The 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
- 国際学会
[学会発表] Data augmentation and feature extraction using variational autoencoder for acoustic modeling,2017
- 著者名/発表者名
  Hiromitsu Nishizaki
- 学会等名
  The 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
- 国際学会
[学会発表] Usability and Learning Effect Evaluations of an Electrical Note-Taking Support System with Speech Processing Technologies2017
- 著者名/発表者名
  Hiromitsu Nishizaki, Yosuke Narita
- 学会等名
  The 25th International Conference on Computers in Education
- 国際学会
[学会発表] Emotion Classification of Spontaneous Speech Using Spoken Term Detection2017
- 著者名/発表者名
  Hiromitsu Nishizaki, Kei Watase
- 学会等名
  The 2017 IEEE 6th Global Conference on Consumer Electronics
- 国際学会
[学会発表] Parallel Hierarchical Attention Networks with Shared Memory Reader for Multi-Stream Conversational Document Classification2017
- 著者名/発表者名
  Naoki Sawada, Ryo Masumura, Hiromitsu Nishizaki
- 学会等名
  The 18th Annual Conference of the International Speech Communication Association
- 国際学会
[学会発表] 複数認識システムの重要度を用いた正解音素推定器に基づく音声中の検索語検出の検討2017
- 著者名/発表者名
  澤田直輝，西崎博光
- 学会等名
  日本音響学会2017年秋季研究発表会
[学会発表] 小型コンピュータにおけるディープラーニングアプリケーションの動作検証2017
- 著者名/発表者名
  西崎博光，牧野浩二
- 学会等名
  第22回知能メカトロニクスワークショップ
[学会発表] Automatic Explanation Spot Estimation Method Targeted at Text and Figures in Lecture Slides2017
- 著者名/発表者名
  Shoko Tsujimura, Kazumasa Yamamoto, Seiichi Nakagawa
- 学会等名
  The 18th Annual Conference of the International Speech Communication Association
- 国際学会
[学会発表] Detection of overlapping acoustic events based on NMF with shared basis vectors2017
- 著者名/発表者名
  Kazumasa Yamamoto, Chikara Ishikawa, Koya Sahashi, Seiichi Nakagawa
- 学会等名
  The 2017 IEEE 6th Global Conference on Consumer Electronics
- 国際学会
[学会発表] 大規模データベースCSJを用いたDNNに基づくフィルタバンク学習の評価2017
- 著者名/発表者名
  関博史，山本一公，秋葉友良，中川聖一
- 学会等名
  日本音響学会2017年秋季研究発表会
[学会発表] Collecting Know-How Sites based on Search Engine Suggests and a Topic Model2017
- 著者名/発表者名
  Jiaqi Li, Shuto Kawabata, Yi Ding, Youchao Lin, Takehito Utsuro, and Yasuhide Kawada,
- 学会等名
  The 17th China-Japan Natural Language Processing Joint Research Promotion Conference
- 国際学会
[学会発表] Clustering search engine suggests by integrating a topic model and word embeddings2017
- 著者名/発表者名
  Tian Nie, Yi Ding, Chen Zhao, Youchao Lin, Takehito Utsuro, and Yasuhide Kawada
- 学会等名
  The 18th IEEE/ACIS International Conference on Software Engineering, Artificial Intelligence
- 国際学会
[学会発表] トピックモデルおよび分散表現の併用による検索エンジン・サジェストの集約2017
- 著者名/発表者名
  聶添，丁易，李佳奇，宇津呂武仁，河田容英
- 学会等名
  第31回人工知能学会全国大会
[図書] 算数＆ラズパイから始めるディープ・ラーニング2018
- 著者名/発表者名
  牧野浩二，西崎博光
- 総ページ数
  208
- 出版者
  CQ出版社
[備考] 「検索エンジンを使ってみんなが調べたこと」を集約・俯瞰する
- URL
  http://nlp.iit.tsukuba.ac.jp/research/list03-sg-cluster.html
[備考] ウェブからノウハウ知識を集めよう
- URL
  http://nlp.iit.tsukuba.ac.jp/research/list03-sg-know-how.html

2017 年度 実績報告書

音声処理・言語処理技術を用いた作業記録・手順書作成方式に基づく技術伝承システム

研究代表者

西崎 博光 山梨大学, 大学院総合研究部, 准教授 (40362082)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 音声認識にむけた超高齢者音声のコーパス構築2017

著者名/発表者名

雑誌名

[学会発表] 技術伝承のための作業記録の作成・閲覧支援システムの開発2018

著者名/発表者名

学会等名

[学会発表] 複数言語を同時に扱える音声認識のための音響モデリングの検討2018

著者名/発表者名

学会等名

[学会発表] Robust lecture speech translation for speech misrecognition and its rescoring effect from multiple candidates2018

著者名/発表者名

学会等名

[学会発表] トピックモデル・分散表現の併用によるウェブ検索結果話題集約におけるサブトピック化2018

著者名/発表者名

学会等名

[学会発表] トピックモデルおよび分類器学習を用いたノウハウサイトの同定2018

著者名/発表者名

学会等名

[学会発表] 高齢者音声の収録・分析・認識2017

著者名/発表者名

学会等名

[学会発表] Acoustic modeling with a shared phoneme set for multilingual speech recognition without code-switching,2017

著者名/発表者名

学会等名

[学会発表] Data augmentation and feature extraction using variational autoencoder for acoustic modeling,2017

著者名/発表者名

学会等名

[学会発表] Usability and Learning Effect Evaluations of an Electrical Note-Taking Support System with Speech Processing Technologies2017

著者名/発表者名

学会等名

[学会発表] Emotion Classification of Spontaneous Speech Using Spoken Term Detection2017

著者名/発表者名

学会等名

[学会発表] Parallel Hierarchical Attention Networks with Shared Memory Reader for Multi-Stream Conversational Document Classification2017

著者名/発表者名

学会等名

[学会発表] 複数認識システムの重要度を用いた正解音素推定器に基づく音声中の検索語検出の検討2017

著者名/発表者名

学会等名

[学会発表] 小型コンピュータにおけるディープラーニングアプリケーションの動作検証2017

著者名/発表者名

学会等名

[学会発表] Automatic Explanation Spot Estimation Method Targeted at Text and Figures in Lecture Slides2017

著者名/発表者名

学会等名

[学会発表] Detection of overlapping acoustic events based on NMF with shared basis vectors2017

著者名/発表者名

学会等名

[学会発表] 大規模データベースCSJを用いたDNNに基づくフィルタバンク学習の評価2017

著者名/発表者名

学会等名

[学会発表] Collecting Know-How Sites based on Search Engine Suggests and a Topic Model2017

著者名/発表者名

学会等名

[学会発表] Clustering search engine suggests by integrating a topic model and word embeddings2017

著者名/発表者名

学会等名

[学会発表] トピックモデルおよび分散表現の併用による検索エンジン・サジェストの集約2017

著者名/発表者名

学会等名

[図書] 算数＆ラズパイから始めるディープ・ラーニング2018

著者名/発表者名

総ページ数

出版者

[備考] 「検索エンジンを使ってみんなが調べたこと」を集約・俯瞰する

URL

[備考] ウェブからノウハウ知識を集めよう

URL

2017 年度実績報告書

西崎博光山梨大学, 大学院総合研究部, 准教授 (40362082)