• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

Research Project

Project/Area Number 23240023
Research InstitutionNara Institute of Science and Technology

Principal Investigator

猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)

Co-Investigator(Kenkyū-buntansha) 戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
鹿野 清宏  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
小野 順貴  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)
宮部 滋樹  筑波大学, システム情報工学研究科, 助教 (50598745)
Keywords音声情報処理 / 統計的学習理論
Research Abstract

本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。
本年度は、以下の4項目に関して研究を遂行した。
(1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎データベースの収録を行った。具体的には、音声信号や自然音(各種雑音もむ)から構成される音響イベントを、バイノーラル録音等で使用されている頭部模擬装置を用いて収録し、データベース化した。
(2)両耳補聴器の基礎アルゴリズムを確立するため、一般化ガンマ分布による統計モデリングに基づく独立成分分析アルゴリズムを導出し、実環境模擬データに対する分離評価を行った。また、予定以上の成果として、市販のKinectセンサ上に本アルゴリズムをリアルタイム実装し、実環境でのリアルタイム動作の確認を行った。
(3)高精度処理に向け、補助関数型ICAやカーネルICAの数理を統計量追跡の観点から理論整備し、実環境模擬データに対する分離評価を行った。
(4)音情報拡張の基礎を確立するため、声質表現語をパラメータとする声質変換処理を導出し、その実データに関する評価を行った。また、音声認識による情報変換の検討も行った。
上記の項目を実施することにより、本研究課題の基盤データ整備および基礎アルゴリズムの検討が完了した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

予定では来年度以降に検討することになっていた「独立成分分析アルゴリズムのリアルタイム実装」を23年度中に開始し、評価実験を行った。

Strategy for Future Research Activity

音源分離関連の研究においては、既に計画を先取りしてリアルタイム化に成功していることより、このテストベッドを有効に活用してアルゴリズム開発を推進する。補聴器応用としては、実際の人間頭部伝達関数の測定を行い、それを用いて個人性に関する実験評価を実施する。また、情報変換の例として、音声認識による評価も実施する。声質変換に関しては、現在までに確立した統計的声質変換モデルの精度向上を目指す。

  • Research Products

    (51 results)

All 2012 2011

All Journal Article (3 results) (of which Peer Reviewed: 2 results) Presentation (48 results)

  • [Journal Article] Theoretical analysis of amounts of musical noise and speech distortion in structure-generalized parametric spatial subtraction array2012

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: Vol.95-A Pages: 586-590

    • Peer Reviewed
  • [Journal Article] Speech prior estimation for generalized minimum mean-square error short-time spectral amplitude estimator2012

    • Author(s)
      Ryo Wakisaka, Hiroshi Saruwatari, Kiyohiro Shikano, Tomoya Takatani
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: Vol.95-A Pages: 591-595

    • Peer Reviewed
  • [Journal Article] Kinectのマイクロホン・アレーによる音声信号処理2012

    • Author(s)
      鎌上記良, 大沼侑司, 猿渡洋, 鹿野清宏, 高橋祐
    • Journal Title

      INTERFACE

      Volume: 1月号 Pages: 112-116

  • [Presentation] Musical-noise-free speech enhancement : Theory and evaluation2012

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Takayuki Inoue, Kiyohiro Shikano, Kazunobu Kondo
    • Organizer
      IEEE International Conference on Acoustics, Speech, and Signal Processing 2012 (ICASSP2012)
    • Place of Presentation
      Kyoto International Conference Center (Kyoto)
    • Year and Date
      2012-03-29
  • [Presentation] Speech kurtosis estimation from observed noisy signal based on generalized Gaussian distribution prior and additivity of cumulants2012

    • Author(s)
      Ryo Wakisaka, Hiroshi Saruwatari, Kiyohiro Shikano, Tomoya Takatani
    • Organizer
      IEEE International Conference on Acoustics, Speech, and Signal Processing 2012 (ICASSP2012)
    • Place of Presentation
      Kyoto International Conference Center (Kyoto)
    • Year and Date
      2012-03-28
  • [Presentation] Iterative blind spatial subtraction array for musical-noise-free speech enhancement in diffuse noise2012

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo
    • Organizer
      電子情報通信学会応用音響研究会
    • Place of Presentation
      日立製作所中央研究所(東京)
    • Year and Date
      2012-03-16
  • [Presentation] 音声認識結果を用いた統計的機械翻訳による音声情報案内システム応答分の分析2012

    • Author(s)
      西村一馬, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] 発音付与のためのEMアルゴリズムを用いた多対多アライメントの評価2012

    • Author(s)
      久保慶伍, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] Juliusにおける複数言語モデルの検討2012

    • Author(s)
      吉田雄太, 真嶋温佳, 平井良佑, 久保慶伍, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] Semi-Supervised Topic Detection with Transductive SVM2012

    • Author(s)
      トーレスラファエル, 川波弘道, 松井知子, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] 音声認識結果による類似スコアを用いた質問応答データベース拡張コストの削減2012

    • Author(s)
      平井良佑, 竹内翔大, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] 多チャネルMMSE-STSA推定法を用いた定位保持型両耳補聴システムの評価2012

    • Author(s)
      脇坂龍, 猿渡洋, 鹿野清宏, Frederic Mustiere, Martin Bouchard
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] ミュージカルノイズフリー雑音抑圧における音声歪み量の性能評価2012

    • Author(s)
      宮崎亮一, 猿渡洋, 鹿野清宏, 近藤多伸
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] 基底間距離最大化規範による拘束条件付き教師有り非負値行列因子分解を用いた目的楽器音抽出とその評価2012

    • Author(s)
      八木浩介, 猿渡洋, 鹿野清宏, 近藤多伸, 高橋祐
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] 高次相関を用いた非線形MUSICによる高分解能方位推定2012

    • Author(s)
      杉本侑哉, 宮部滋樹, 山田武志, 牧野昭二
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-15
  • [Presentation] 非可聴つぶやき認識のためのブラインド雑音抑圧におけるステレオ信号統合法2012

    • Author(s)
      石井隼太, 戸田智基, 猿渡洋, Sakriani Sakti, 中村哲
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-13
  • [Presentation] Kinectを用いた話者位置トラッキングの併用による雑音抑圧処理の高精度化2012

    • Author(s)
      大沼侑司, 鎌上記良, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-13
  • [Presentation] ポスタ会議発表の音声アーカイブ構築を目的としたブラインド音声抽出と発話区間推定2012

    • Author(s)
      岡本広大, 宮崎亮一, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-13
  • [Presentation] 時間周波数領域におけるグリッド間の整合性に基づくクリッピングの除去2012

    • Author(s)
      三浦晋, 宮部滋樹, 山田武志, 牧野昭二, 中島弘史, 中臺一博
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(神奈川)
    • Year and Date
      2012-03-13
  • [Presentation] Music Sginal Separation by Orthogonality and Maximum-Distance Constrained Nonnegative Matrix Factorization with Target Signal Information2012

    • Author(s)
      Kosuke Yagi, Yu Takahashi, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo
    • Organizer
      Audio Engineering Society 45th International Conference
    • Place of Presentation
      Dipoli Conference Center (Helsinki, Finland)
    • Year and Date
      2012-03-02
  • [Presentation] Generalized MMSE STSA Estimator with ICA-Based Noise Estimation and Speech Prior Estimation for Binaural Hearing Aids2012

    • Author(s)
      Ryo Wakisaka, Hiroshi Saruwatari, Kiyohiro Shikano, Tomoya Takatani
    • Organizer
      Audio Engineering Society 45th International Conference
    • Place of Presentation
      Dipoli Conference Center (Helsinki, Finland)
    • Year and Date
      2012-03-02
  • [Presentation] ユーザ動作を許容する非可聴つぶやき認識のためのブラインド雑音抑圧法の改良2012

    • Author(s)
      石井隼太, 戸田智基, 猿渡洋, Sakriani Sakti, 中村哲
    • Organizer
      電子情報通信学会応用音声研究会
    • Place of Presentation
      東北大学(宮城)
    • Year and Date
      2012-02-10
  • [Presentation] ポスタ会議発表音声アーカイブ構築を目的としたブラインド音声抽出の評価2012

    • Author(s)
      岡本広大, 宮崎亮一, 猿渡洋, 鹿野清宏
    • Organizer
      電子情報通信学会応用音響研究会
    • Place of Presentation
      関西大学(大阪)
    • Year and Date
      2012-01-26
  • [Presentation] Evaluation of musical-noise-free noise reduction under real acoustic environments2012

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo
    • Organizer
      電子情報通信学会応用音響研究会
    • Place of Presentation
      関西大学(大阪)
    • Year and Date
      2012-01-26
  • [Presentation] Semi-Blind Speech Extraction for Robot Using Visual Information and Noise Statistics2011

    • Author(s)
      Hiroshi Saruwatari, Nobuhisa Hirata, Toshiyuki Hatta, Ryo Wakisaka, Kiyohiro Shikano, Tomoya Takatani
    • Organizer
      11th IEEE International Symposium on Signal Processing and Information Technology
    • Place of Presentation
      University of Deusto (Bilbao, Spain)
    • Year and Date
      2011-12-15
  • [Presentation] Blind noise suppression for non-audible murmur recognition with stereo signal processing2011

    • Author(s)
      Shunta Ishii, Tomoki Toda, Hiroshi Saruwatari, Sakriani Sakti, Satoshi Nakamura
    • Organizer
      IEEE 2011 Automatic Speech Recognition and Understanding Workshop (ASRU2011)
    • Place of Presentation
      Hilton Waikoloa (Hawaii, USA)
    • Year and Date
      2011-12-15
  • [Presentation] Kinectにおけるリアルタイム・ブラインド空間サブトラクションアレーの実装と評価2011

    • Author(s)
      大沼侑司, 鎌土記良, 宮崎亮一, 猿渡洋, 鹿野清宏
    • Organizer
      第34回人工知能学会AIチャレンジ研究会
    • Place of Presentation
      慶應義塾大学日吉キャンパス(神奈川)
    • Year and Date
      2011-12-15
  • [Presentation] 一般化ガウス分布仮説とキュムラントの加法性を利用した雑音中からの音声カートシス逆推定2011

    • Author(s)
      脇坂龍, 猿渡洋, 鹿野清宏, 高谷智哉
    • Organizer
      第26回信号処理シンポジウム
    • Place of Presentation
      札幌コンベンションセンター(北海道)
    • Year and Date
      2011-11-16
  • [Presentation] ユージカルノイズフリー雑音抑圧の一般化理論とその信号抽出への応用2011

    • Author(s)
      宮崎亮一, 猿渡洋, 鹿野清宏, 近藤多伸
    • Organizer
      第26回信号処理シンポジウム
    • Place of Presentation
      札幌コンベンションセンター(北海道)
    • Year and Date
      2011-11-16
  • [Presentation] 非可聴つぶやき認識のためのステレオ信号を用いたブラインド雑音抑圧法2011

    • Author(s)
      石井隼太, 戸田智基, 猿渡洋, Sakriani Sakti, 中村哲
    • Organizer
      音声言語情報処理研究会
    • Place of Presentation
      国立オリンピック記念青少年総合センター(東京)
    • Year and Date
      2011-10-28
  • [Presentation] Unconstrained Many-to-Many Alignment for Automatic Pronunciation Annotation2011

    • Author(s)
      Keigo Kubo, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano
    • Organizer
      APSIPA Annual Summit and Conference 2011
    • Place of Presentation
      Grand New World Hotel Xian (Xian, China)
    • Year and Date
      2011-10-20
  • [Presentation] Investigation of Statistical Machine Translation Applied to Answer Generation for a Speech-Oriented Guidance System2011

    • Author(s)
      Kazuma Nishimura, Hiromichi Kawanami, Hiroshi Saruwatari, Kiyohiro Shikano
    • Organizer
      APSIPA Annual Summit and Conference 2011
    • Place of Presentation
      Grand New World Hotel Xian (Xian, China)
    • Year and Date
      2011-10-20
  • [Presentation] Topic Classification of Spoken Inquiries Based on Stacked Generalization2011

    • Author(s)
      Rafael Torres, Hiromichi Kawanami, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano
    • Organizer
      APSIPA Annual Summit and Conference 2011
    • Place of Presentation
      Grand New World Hotel Xian (Xian, China)
    • Year and Date
      2011-10-20
  • [Presentation] Development and Operation of Speech-Oriented Information Guidance Systems, Kita-chan and Kita-robo2011

    • Author(s)
      Hiromichi Kawanami, Shota Takeuchi, Rafael Torres, Hiroshi Saruwatari, Kiyohiro Shikano
    • Organizer
      APSIPA Annual Summit and Conference 2011
    • Place of Presentation
      Grand New World Hotel Xian (Xian, China)
    • Year and Date
      2011-10-20
  • [Presentation] Stable and fast update rules for independent vector analysis based on auxiliary function technique2011

    • Author(s)
      Nobutaka Ono
    • Organizer
      IEEE Workshop on Applications of Signal Processing to Audio and Acoustics
    • Place of Presentation
      Mohonk Mountain House (New York, USA)
    • Year and Date
      2011-10-18
  • [Presentation] Recent advances on noise reduction and source separation technology for robot audition2011

    • Author(s)
      Hiroshi Saruwatari
    • Organizer
      IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS2011)
    • Place of Presentation
      Hilton San Francisco Union Squire (San Francisco, USA)(招待講演)
    • Year and Date
      2011-09-26
  • [Presentation] 非可聴つぶやき認識におけるユーザ動作に伴う雑音に起因する性能低下の抑制2011

    • Author(s)
      石井隼太, 戸田智基, 猿渡洋, Sakriani Sakti, 中村哲
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-22
  • [Presentation] 展示会場での運用のための音声情報案内システム「たけまるくん」のデータベース拡張2011

    • Author(s)
      川波弘道, 久保慶伍, 木佐木雄介, トーレスラファエル, 鹿野清宏
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-22
  • [Presentation] Evaluation of Topic Classification of Spoken Inquiries2011

    • Author(s)
      トーレスラファエル, 川波弘道, 松井知子, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-22
  • [Presentation] 遷都1300年祭会場における音声情報案内システムの運用と発話データの分析2011

    • Author(s)
      平井良佑, 久保慶伍, 木佐木雄介, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-22
  • [Presentation] 音声情報案内システムにおける統計的機械翻訳の手法を用いた応答文生成手法の検討2011

    • Author(s)
      西村一馬, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-22
  • [Presentation] 定位保持型MMSE-STSA推定に基づく両耳補聴システムの評価2011

    • Author(s)
      脇坂龍, 猿渡洋, 鹿野清宏, 高谷智哉
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-22
  • [Presentation] ポスタ会議発表の音声アーカイブ構築を目的としたブラインド音声抽出2011

    • Author(s)
      岡本広大, 宮崎亮一, 猿渡洋, 鹿野清宏
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-21
  • [Presentation] 補助関数法に基づく独立ベクトル分析の高速学習則2011

    • Author(s)
      小野順貴
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-21
  • [Presentation] ミュージカルノイズフリー雑音抑圧理論とその評価2011

    • Author(s)
      宮崎亮一, 猿渡洋, 井上貴之, 鹿野清宏, 近藤多伸
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-20
  • [Presentation] 拘束条件付き教師あり非負値行列因子分解による目的楽器音抽出とその評価2011

    • Author(s)
      八木浩介, 猿渡洋, 鹿野清宏, 近藤多伸, 高橋祐
    • Organizer
      日本音響学会2011年秋季研究発表会
    • Place of Presentation
      島根大学(島根)
    • Year and Date
      2011-09-20
  • [Presentation] Theoretical analysis of musical noise and speech distortion in structure-generalized parametric blind spatial subtraction array2011

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano
    • Organizer
      INTERSPEECH2011
    • Place of Presentation
      Conference Center (Florence, Italy)
    • Year and Date
      2011-08-29
  • [Presentation] Blind speech prior estimaion for generalized minimum mean-square error short-time spectral amplitude estimator2011

    • Author(s)
      Ryo Wakisaka, Hiroshi Saruwatari, Kiyohiro Shikano, Tomoya Takatani
    • Organizer
      INTERSPEECH2011
    • Place of Presentation
      Conference Center (Florence, Italy)
    • Year and Date
      2011-08-29
  • [Presentation] 統計的機械翻訳の手法を用いた音声情報案内システムのための応答文生成手法の検討2011

    • Author(s)
      西村一馬, 川波弘道, 猿渡洋, 鹿野清宏
    • Organizer
      音声言語情報処理研究会
    • Place of Presentation
      定山渓グランドホテル瑞苑(北海道)
    • Year and Date
      2011-07-22
  • [Presentation] 教師あり非負値行列因子分解による目的楽器音信号の抽出2011

    • Author(s)
      八木浩介, 猿渡洋, 鹿野清宏, 近藤多伸, 高橋祐
    • Organizer
      電子情報通信学会応用音響研究会
    • Place of Presentation
      キャンパスポート大阪(大阪)
    • Year and Date
      2011-07-15
  • [Presentation] Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction2011

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Ryo Wakisaka, Kiyohiro Shikano, Tomoya Takatani
    • Organizer
      Joint Workshop on Hands-free Speech Communication and Microphone Arrays 2011
    • Place of Presentation
      Edinburgh University (Edinburgh, UK)
    • Year and Date
      2011-05-30

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi