• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

Research Project

Project/Area Number 23240023
Research InstitutionNara Institute of Science and Technology

Principal Investigator

猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)

Co-Investigator(Kenkyū-buntansha) 戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
小野 順貴  国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (80334259)
宮部 滋樹  筑波大学, システム情報工学研究科(系), 助教 (50598745)
牧野 昭二  筑波大学, システム情報工学研究科(系), 教授 (60396190)
Project Period (FY) 2011-04-01 – 2015-03-31
Keywords音声情報処理 / 統計的学習理論
Research Abstract

本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。本年度は、以下の4項目に関して研究を遂行した。(1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎データベースの収録を24年度に引き続き行った。ここでは、主に実環境騒音の収集に注力し、最終的に昨年度完備した20名分の頭部伝達関数と併せ、騒音化での両耳受聴が模擬できるシミュレータ環境を構築した。(2)両耳補聴器システムを確立するため、統計量追跡による非線形信号処理の最適化問題を数理的に議論した。特に、4次統計量不動点に基づく聴覚印象不動処理を独立成分分析アルゴリズムに導入し、実環境模擬データに対する分離評価を行った。特に本年は、ベイズ型音声振幅スペクトル推定における4次統計量不動点を世界で初めて発見し、それを応用したミュージカルノイズフリー音声強調法を開発した。(3)高精度処理に向け、補助関数型ベクトルICAや高次統計量型方向推定の数理を統計量追跡の観点から理論整備し、実環境模擬データベースを用いて評価を行った。(4)発話補助処理システムを確立するため、データベース間における発話のミスマッチを許容する声質変換処理を開発し、その評価を行った。上記の項目を実施することにより、本研究課題の基盤データ整備および基礎アルゴリズムの検討が完了した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

「高次統計量に基づく品質定量化」に関して、申請時計画には無かった「ベイズ推定における高次統計量不動点の発見」と「それを応用したミュージカルノイズフリー処理(品質劣化が一切起きない理論」を世界で初めて理論展開・実証した。特に前者は、通常行われるベイズ推定において不動点が存在しないことを証明し、推定における人工バイアスを加味することによって不動点現象が発芽することを世界で初めて示した。これにより、23年、24年までに開発したスペクトルサブトラクション(これは音声振幅スペクトルの最尤推定に相当)における高次統計量不動点理論と併せ、代表的な複数の統計推定法における高次統計量不動点の理論が整備された。

Strategy for Future Research Activity

音源分離関連の研究においては、既に計画を先取りしてマルチモーダル化・リアルタイム化に成功していることより、このテストベッドと高次統計量不動点の研究とを融合させ、最終年度に向けたシステム開発を推進する。補聴器応用としては、実際の人間頭部伝達関数の測定が完了したので、それを用いて個人性や環境依存性に関する実験評価を実施する。また、情報変換の例として、音声認識による評価も実施する。声質変換に関しては、現在までに確立した統計的声質変換モデルの精度向上を目指す。

  • Research Products

    (23 results)

All 2014 2013 Other

All Journal Article (7 results) (of which Peer Reviewed: 7 results) Presentation (15 results) (of which Invited: 6 results) Book (1 results)

  • [Journal Article] Alaryngeal speech enhancement based on one-to-many eigenvoice conversion2014

    • Author(s)
      Hironori Doi, Tomoki Toda, Keigo Nakamura, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      IEEE Transactions on Audio, Speech and Language Processing

      Volume: 22 Pages: 172-183

    • Peer Reviewed
  • [Journal Article] Music signal separation based on supervised nonnegative matrix factorization with orthogonality and maximum-divergence penalties2014

    • Author(s)
      Daichi Kitamura, Hiroshi Saruwatari, Kosuke Yagi, Kiyohiro Shikano, Yu Takahashi, Kazunobu Kondo
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E97-A Pages: 1113-1118

    • Peer Reviewed
  • [Journal Article] Musical-noise-free blind speech extraction integrating microphone array and iterative spectral subtraction2014

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard
    • Journal Title

      Signal Processing (Elsevier)

      Volume: 102 Pages: 226-239

    • Peer Reviewed
  • [Journal Article] Design of multichannel frequency domain statistical-based enhancement systems preserving spatial cues via spectral distances minimization2013

    • Author(s)
      Frederic Mustiere, Martin Bouchard, Hossein Najaf-Zadeh, Ramin Pichevar, Louis Thibault, Hiroshi Saruwatari
    • Journal Title

      Signal Processing (Elsevier)

      Volume: 93 Pages: 321-325

    • Peer Reviewed
  • [Journal Article] 日本語の未知語に対する発音付与のための多対多アライメント2013

    • Author(s)
      久保慶伍, 川波弘道, 猿渡洋, 鹿野清宏
    • Journal Title

      情報処理学会論文誌

      Volume: 54 Pages: 452-462

    • Peer Reviewed
  • [Journal Article] 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却2013

    • Author(s)
      真嶋温佳, 藤田洋子, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏
    • Journal Title

      情報処理学会論文誌

      Volume: 54 Pages: 443-451

    • Peer Reviewed
  • [Journal Article] Comparison of methods for topic classification of spoken inquiries2013

    • Author(s)
      Rafael Torres, Hiromichi Kawanami, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      IPSJ Journal

      Volume: 54 Pages: 157-167

    • Peer Reviewed
  • [Presentation] 高次統計量は何を語る? ~教師無し学習に基づく自律的な音メディア信号処理~2014

    • Author(s)
      猿渡洋
    • Organizer
      音学シンポジウム2014
    • Place of Presentation
      日本大学文理学部百周年記念館, 東京
    • Year and Date
      20140524-20140525
    • Invited
  • [Presentation] Robust music signal separation based on supervised nonnegative matrix factorization with prevention of basis sharing2013

    • Author(s)
      Daichi Kitamura, Hiroshi Saruwatari, Kosuke Yagi, Kiyohiro Shikano, Yu Takahashi, Kazunobu Kondo
    • Organizer
      IEEE International Symposium on Signal Processing and Information Technology (ISSPIT2013)
    • Place of Presentation
      Divani Palace Acropolis, Athens, Greece
    • Year and Date
      20131212-20131215
  • [Presentation] Theoretical analysis of musical noise generation for blind speech extraction with generalized MMSE short-time spectral amplitude estimator2013

    • Author(s)
      Shunsuke Nakai, Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura
    • Organizer
      Intelligent Signal Processing Conference
    • Place of Presentation
      Strand Palace Hotel, London, UK
    • Year and Date
      20131202-20131203
  • [Presentation] Information-geometric optimization in nonlinear noise reduction systems2013

    • Author(s)
      Hiroshi Saruwatari
    • Organizer
      2013 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS2013)
    • Place of Presentation
      Okinawa Jichi-Kaikan, Naha, Okinawa, Japan
    • Year and Date
      20131112-20131115
    • Invited
  • [Presentation] Toward musical-noise-free blind speech extraction: concept and its applications2013

    • Author(s)
      Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard
    • Organizer
      APSIPA Annual Summit and Conference (APSIPA2013)
    • Place of Presentation
      The 85 sky tower hotel, Kaohsiung, Taiwan
    • Year and Date
      20131029-20131101
    • Invited
  • [Presentation] Semi-blind algorithm for joint noise suppression and dereverberation based on higher-order statistics and acoustic model likelihood2013

    • Author(s)
      Fine Aprilyanti, Hiroshi Saruwatari, Kiyohiro Shikano, Satoshi Nakamura, Tomoya Takatani
    • Organizer
      APSIPA Annual Summit and Conference (APSIPA2013)
    • Place of Presentation
      The 85 sky tower hotel, Kaohsiung, Taiwan
    • Year and Date
      20131029-20131101
  • [Presentation] The 2013 Signal Separation Evaluation Campaign2013

    • Author(s)
      Nobutaka Ono, Zbynek Koldovsky, Shigeki Miyabe and Nobutaka Ito
    • Organizer
      IEEE International Workshop on Machine Learning for Signal Processing 2013
    • Place of Presentation
      Chilworth Manor Hotel & Conference Centre, Southampton, UK
    • Year and Date
      20130922-20130925
  • [Presentation] Blind Source Separation on iPhone in Real Environment2013

    • Author(s)
      Nobutaka Ono
    • Organizer
      EUSIPCO2013
    • Place of Presentation
      Palais des Congres, Marrakech, Morocco
    • Year and Date
      20130909-20130913
  • [Presentation] Musical noise analysis for Bayesian minimum mean-square error speech amplitude estimators based on higher-order statistics2013

    • Author(s)
      Hroshi Saruwatari, Suzumi Kanehara, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo
    • Organizer
      INTERSPEECH2013
    • Place of Presentation
      Lyon Convention Centre, Lyon, France
    • Year and Date
      20130825-20130829
  • [Presentation] Music signal separation by supervised nonnegative matrix factorization with basis deformation2013

    • Author(s)
      Daichi Kitamura, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo, Yu Takahashi
    • Organizer
      18th International Conference on Digital Signal Processing (DSP2013)
    • Place of Presentation
      Nomikos Conference Centre, Santorini, Greece
    • Year and Date
      20130701-20130703
  • [Presentation] Superresolution-based stereo signal separation via supervised nonnegative matrix factorization2013

    • Author(s)
      Daichi Kitamura, Hiroshi Saruwatari, Yusuke Iwao, Kiyohiro Shikano, Kazunobu Kondo, Yu Takahashi
    • Organizer
      18th International Conference on Digital Signal Processing (DSP2013)
    • Place of Presentation
      Nomikos Conference Centre, Santorini, Greece
    • Year and Date
      20130701-20130703
  • [Presentation] Regularized superresolution-based binaural signal separation with nonnegative matrix factorization2013

    • Author(s)
      Daichi Kitamura, Hiroshi Saruwatari, Yusuke Iwao, Kiyohiro Shikano, Kazunobu Kondo, Yu Takahashi
    • Organizer
      2013 International Conference on 3D Systems and Applications (3DSA2013)
    • Place of Presentation
      Grandfront Osaka, Osaka, Japan
    • Year and Date
      20130626-20130628
  • [Presentation] 補助関数型独立ベクトル分析による高速ブラインド音源分離2013

    • Author(s)
      小野順貴
    • Organizer
      電子情報通信学会電気音響研究会
    • Place of Presentation
      岡山大学創立五十周年記念館, 岡山県岡山市
    • Year and Date
      20130516-20130517
    • Invited
  • [Presentation] 高次統計量追跡に基づくブラインド信号抽出およびその高品質化

    • Author(s)
      猿渡洋
    • Organizer
      電子情報通信学会電気音響研究会
    • Place of Presentation
      機械振興会館, 東京
    • Invited
  • [Presentation] これからの応用音響研究のあり方について

    • Author(s)
      猿渡洋
    • Organizer
      電子情報通信学会電気音響研究会パネル討論セッション
    • Place of Presentation
      機械振興会館, 東京
    • Invited
  • [Book] Statistical analysis and evaluation of blind speech extraction algorithms (in book chapter)2014

    • Author(s)
      Hiroshi Saruwatari, Ryoichi Miyazaki
    • Total Pages
      32
    • Publisher
      Springer

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi