• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

連続音声認識手法を用いた音楽情報処理の研究

Research Project

Project/Area Number 14380156
Research InstitutionThe University of Tokyo

Principal Investigator

嵯峨山 茂樹  東京大学, 大学院・情報理工学系研究科, 教授 (00303321)

Co-Investigator(Kenkyū-buntansha) 西本 卓也  東京大学, 大学院・情報理工学系研究科, 助手 (80283696)
田原 鉄也  東京大学, 大学院・情報理工学系研究科, 科学技術振興特任研究員(常勤形態) (90272393)
Keywords音楽情報処理 / 連続音声認識 / 確率モデル / リズム認識 / ハーモニッククラスタリング / 時空間クラスタリング / Specmurt法 / 自動対位法
Research Abstract

1.テンポに依存しない多声音楽演奏からのリズム認識
テンポが未知である多声楽曲のMIDI演奏を対象としたリズム認識手法を検討した。また、急激にテンポが起きた時点をセグメンタルk-meansアルゴリズムを用いて推定する手法を検討した。さらに、確率文脈自由文法を応用して複旋律の音情報を直接解析する手法についても検討した。
2.多重音からの基本周波数の抽出(ハーモニック・クラスタリングおよび時空間クラスタリング)
多重音スペクトルから個々の音ごとに基本周波数の検出とスペクトル分離を行う手法として、高調波の拘束を用いた混合正規分布モデルでスペクトルを推定する手法(ハーモニック・クラスタリング)の改良を行った。また、時間方向と周波数方向を同時にモデリングしてEMアルゴリズムを行う手法(時空間クラスタリング)を新たに提案し、音楽音響信号から演奏情報(MIDIデータなど)を高精度に求められることを確認した。
3.基本周波数の解析手法(Specmurt法)
多重音を対象とした基本周波数の解析手法としてSpecmurt法を提案し、その改良を行った。多重音を構成する各音が共通した調波構造パターンのスペクトルを持つ場合、対数周波数軸ではこれらは同一の倍音パターン形状を平行移動した関係となる。これを多重音の基本周波数の分布と共通調波構造パターンとの畳み込みと解釈し、逆演算によって基本周波数の連続分布を得る。特に、共通調波構造パターンをEMアルゴリズムで推定することにより精度の向上を確認した。
4.動的計画法に基づく自動対位法
対位法に基づき定旋律から対旋律を自動生成する手法を検討した。この問題を確率最大化問題として定式化し、動的計画法により対旋律を探索するアルゴリズムを実装した。楽曲サンプルの統計を確率モデルに反映することにより、二声の自由対位法において、対位法らしい対旋律が得られることを検証した。

  • Research Products

    (13 results)

All 2005 2004

All Journal Article (13 results)

  • [Journal Article] 動的計画法に基づく自動対位法2005

    • Author(s)
      中潟昌平, 西本卓也, 嵯峨山茂樹
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 3-7-2

      Pages: 587-588

  • [Journal Article] ガウス基底2次元分布モデルを用いた時空間クラスタリングによる音響ストリームの分離2005

    • Author(s)
      亀岡弘和, 西本卓也, 嵯峨山茂樹
    • Journal Title

      日本音響学会2005年春季研究発表会講演論文集 3-7-19

      Pages: 601-602

  • [Journal Article] Audio Stream Segregation Based on Time-Space Clustering Using Gaussian Kernel 2-Dimensional Model2005

    • Author(s)
      Hirokazu Kameoka, Takuya Nishimoto, Shigeki Sagayama
    • Journal Title

      Proc.IEEE, International Conference on Acoustics, Speech and Signal Processing(ICASSP 2005)

  • [Journal Article] Extraction of Multiple Fundamental Frequencies from Polyphonic Music Using Harmonic Clustering2004

    • Author(s)
      Hirokazu Kameoka, Takuya Nishimoto, Shigeki Sagayama
    • Journal Title

      Proc.International Congress on Acoustics(ICA)

  • [Journal Article] Separation of Harmonic Structures Based on Tied Gaussian Mixture Model and Information Criterion for Concurrent Sounds2004

    • Author(s)
      Hirokazu Kameoka, Takuya Nishimoto, Shigeki Sagayama
    • Journal Title

      Proc.IEEE, International Conference on Acoustics, Speech and Signal Processing(ICASSP 2004) (CD-ROM)

  • [Journal Article] 調波スペクトル分離の原理Harmonic Clusteringと赤池情報量 規準による多声部楽曲音響信号の同時発音数および多重ピッチの推定2004

    • Author(s)
      亀岡弘和, 西本草也, 嵯峨山茂樹
    • Journal Title

      日本音響学会7月音楽音響研究会資料

  • [Journal Article] 動的計画法と音列出現確率を用いた対位法の対旋律の自動生成2004

    • Author(s)
      中潟昌平, 西本卓也, 嵯峨山茂樹
    • Journal Title

      情報処理学会研究報告(MUS) 2004-MUS-56

      Pages: 65-70

  • [Journal Article] Specmurtにおける共通高調波構造パターンの反復推定による多声音楽信号の可視化とMIDI変換2004

    • Author(s)
      亀岡弘和, 齊藤翔一郎, 西本卓也, 嵯峨山茂樹
    • Journal Title

      情報処理学会研究報告(MUS) 2004-MUS-56

      Pages: 41-48

  • [Journal Article] Specmurt法による音楽信号の音高可視化における共通調波構造パターンの自動決定2004

    • Author(s)
      亀岡弘和, 齊藤翔一郎, 西本卓也, 嵯峨山茂樹
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 2-6-15

      Pages: 803-804

  • [Journal Article] 音声認識と音楽情報処理(招待講演)2004

    • Author(s)
      嵯峨山茂樹, 武田晴登, 亀岡弘和, 西本卓也
    • Journal Title

      日本音響学会2004年秋季研究発表会講演論文集 2-6-9

      Pages: 785-788

  • [Journal Article] Specmurt Analysis : A Piano-Roll-Visualization of Polyphonic Music Signal by Deconvolution of Log-Frequency Spectrum2004

    • Author(s)
      Shigeki Sagayama, Hirokazu Kameoka, Takuya Nishimoto
    • Journal Title

      Proc.2004 ISCA Tutorial and Research Workshop on Statistical and Perceptual Audio Processing(SAPA2004)

  • [Journal Article] Multi-Pitch Trajectory Estimation of Concurrent Speech Based on Harmonic GMM and Nonlinear Kalman Filtering2004

    • Author(s)
      Hirokazu Kameoka, Takuya Nishimoto, Shigeki Sagayama
    • Journal Title

      Proc.International Conference on Spoken Language Processing(ICSLP2004)

      Pages: 1279-1282

  • [Journal Article] Rhythm and Tempo Recognition of Music Performance from a Probabilistic Approach2004

    • Author(s)
      Haruto TAKEDA, Takuya Nishimoto, Shigeki Sagayama
    • Journal Title

      Proc.5th International Conference on Music Information Retrieval(ISMIR)

      Pages: 357-364

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi