• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

ウェブインタフェースに向けた聴覚機構に基づく大人・子ども話者識別技術の研究

研究課題

研究課題/領域番号 25870438
研究種目

若手研究(B)

研究機関和歌山大学

研究代表者

西村 竜一  和歌山大学, システム工学部, 助教 (00379611)

研究期間 (年度) 2013-04-01 – 2015-03-31
キーワード音声情報処理 / ウェブシステム / こども / ディープニューラルネットワーク / 声道長推定
研究概要

本研究は、発話を入力としたコンピュータによる大人・子ども識別法を開発する。下記、2項目を中心に提案法の精度向上を目指した研究開発を行った。
(1) 聴覚特徴の抽出と識別アルゴリズムへの組み込み:識別アルゴリズムに深層学習のニューラルネットワーク(DNN)の導入を試みた。DNNは、従来型である隠れマルコフモデル(HMM)と異なり、そのままでは入力信号の時間伸縮を適切に扱うことが難しい。しかし、識別単位をフレームとした場合でも高い能力を示すことを実験から確認した。また、話者の身体情報を示す特徴の一つとして声道長に着目し、日本語母音データベースを用いた任意発声の相対的声道長の推定手法について検討を加えた。
(2) 特徴的な言語情報を引き出すための対話戦略決定法の検討:過去に我々が収集した発話データの語彙情報を統計的に分析して、対話システムに組み込むことができる形態で、その特徴を抽出した。具体的には、Bag-of-Words及び新聞記事データベースに含まれる語彙の共起情報を検討した。
上記の精度向上のための研究項目と並行して、デモシステムを実装し、本手法を応用システムに展開できることを示した。本システムは、サーバ・クライアントアーキテクチャを採用したウェブシステムである。画像処理用高速プロセッサによるGPGPUを利用することで、現実的な時間で提案法を処理できることを確認した。また、クラウドソーシングを用いた音データの収集法を開発し、次年度以降に予定している公開試験の実験環境を整備した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究の進展によって、大人と子ども発話識別における正解率の向上を着実に得ることができたこと、また、次年度に計画している評価実験で利用する予定のデモシステムを実装できたことから、本研究は順調に進展していると判断した。特に、デモシステムの実装は、当初計画では次年度に予定していた内容を一部含んでおり、若干ではあるが計画を前倒しして実施できた。ただし、その副産物として、想定を超えた計算コストの増大が新しい問題として表面化している。その原因は、アルゴリズムの高度化やデータ処理量の増大にある。これら問題に対して、次年度の研究計画に解決策案を組み込むことができた。これは、早期のリスク回避の観点から、むしろ好ましい結果であったと考えている。

今後の研究の推進方策

これまでの研究成果を統合し、実際に動作するウェブサービスのプロトタイプを作成する。また、提案システムの公開試験を実施する。昨年度実装したデモシステムの完成度を高め、実験環境とすることにより、一般利用者を対象とした公開試験の実施は可能である。しかしながら、利用者に適切なフィードバックを提供するためには処理速度の改善が必要であることがわかっている。これまでの調査から、処理速度の問題の主たる理由が、音響特徴量の抽出処理部分に存在することが判明している。この問題に対し、音響特徴量の構成を見直すとともに、処理を適切に省略することで改善を得ることを目標とする。加えて、これまでのデモシステムは、主にPC端末向けに開発してきたが、クラウドソーシングを活用し、より多くの利用者を獲得するために、Android端末向けに提案システムを移植する。この際、利用者の利便性を確保するためのインタフェースデザインを検討する。

次年度の研究費の使用計画

配分予算の減額を考慮して予算執行計画を再検討した結果、導入を予定していた高速計算用Linuxサーバの購入を今年度は見送ることにした。ただし、既存設備を利用することができ、研究計画の大幅な変更は回避できたと考える。
公開試験を実施するためには高速計算用Linuxサーバを新規導入が必要であるため、購入する予定である。

  • 研究成果

    (6件)

すべて 2014 2013 その他

すべて 学会発表 (5件) 備考 (1件)

  • [学会発表] クラウドソーシングによる環境音収集に向けたスマホアプリの開発2014

    • 著者名/発表者名
      松山みのり, 津田貴彦, 西村竜一, 山田順之介, 入野俊夫, 河原英紀
    • 学会等名
      電子情報通信学会2014年総合大会
    • 発表場所
      新潟大学五十嵐キャンパス
    • 年月日
      20140318-20140321
  • [学会発表] 日本語母音データベースを用いた声道長推定法の校正について2014

    • 著者名/発表者名
      小林真優子, 坂口諒, 西村竜一, 入野俊夫, 河原英紀
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学駿河台キャンパス
    • 年月日
      20140310-20140312
  • [学会発表] 音声から大人と子どもを識別するウェブシステムにおけるDNNの適用2014

    • 著者名/発表者名
      西村竜一, 田藤千弘
    • 学会等名
      日本音響学会2014年春季研究発表会
    • 発表場所
      日本大学駿河台キャンパス
    • 年月日
      20140310-20140312
  • [学会発表] 日本語母音データベースを用いた任意発声の相対的声道長の推定について2013

    • 著者名/発表者名
      小林真優子, 坂口諒, 西村竜一, 入野俊夫, 河原英紀
    • 学会等名
      日本音響学会2013年秋季研究発表会
    • 発表場所
      豊橋科学技術大学
    • 年月日
      20130925-20130927
  • [学会発表] 環境音収集アプリのためのUI設計 ~クラウドソーシング型データ集積サービスの提案~

    • 著者名/発表者名
      松山みのり, 津田貴彦, 西村竜一, 河原英紀, 入野俊夫
    • 学会等名
      日本音響学会関西支部第16回関西支部若手研究者交流研究発表会
    • 発表場所
      産業技術総合研究所関西支部
  • [備考] w3voice Laboratory

    • URL

      http://w3voice.jp/

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi