• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

出現頻度の偏った母集団の希少事象の認識のための通信路符号化モデルの構築

Research Project

Project/Area Number 24500215
Research InstitutionHosei University

Principal Investigator

伊藤 克亘  法政大学, 情報科学部, 教授 (30356472)

Co-Investigator(Kenkyū-buntansha) 西島 利尚  法政大学, 情報科学部, 教授 (70211456)
Keywords音楽情報処理 / 逸脱 / 演奏表現 / 無限混合正規分布
Research Abstract

今年度は、音楽情報処理に関しては、演奏表現の処理のために、逸脱と表現の関係を様々なレベルで明らかにした。特に、擦弦楽器の様々な演奏表現に対応できるような音符内状態推定の手法と、音声波形の音量軌跡をアーティキュレーションと呼ばれる局所的な音量変動による音符内での表現と、ダイナミクスと呼ばれる音符間にわたる大域的な表現に分離する手法を確立した。これらの研究を通じて、演奏表現ごとにさまざまに変化し、従来は上手く扱えなかった希少現象を無限混合正規分布を用いてモデル化することで、扱えるようにした。これらの研究より、印象的な表現(「よい」表現)は、高い技術を持った演奏者が意図的に行う逸脱であり、希少ではあるが、ある程度繰り返して用いられる(生成される)ことがわかった。
話者識別に関しては、ラジオ番組の話者を区別し話者ラベルを付与する、ダイアライゼーションに取り組んだ。一定の性能を示す手法は実現したが、希少現象が扱えないことよりも、話者識別においては、たいていのタスクで学習データが十分ではないことが問題であることが明らかになった。地道な取り組みが評価され、3月の情報処理学会全国大会では、学生奨励賞を受賞した。
音楽だけでなく、音声における表現という現象を解明するために、アニメーションの同一キャラクターを演じる異なる声優間での話者変換の研究を行った。第3話者コーパスを利用した変換という新しい手法を提案することで、異なるテキストを学習データとした話者変換を実現し、3月の情報処理学会全国大会では、学生奨励賞を受賞した。この研究では、一般的なイメージとは異なり、声の高さや発声方法などを大きく変化させる「表現」自体に、声優の個性がでるわけではなく、主として声質に個性が表れており、声質を変換することで一定の話者変換性能が達成された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

演奏者の意図から始めた音楽情報処理の研究を、演奏表現に的を絞り、さらに、その本質が「逸脱」にあることに着目し、それらをモデル化する過程で、希少現象のモデル化の方向性を確立させることができたといえる。このモデル化は、無限混合正規分布に基づいている。この無限混合正規分布は、ポワソン過程と関係が深く、この点から、希少現象を効果的にモデル化することで、多彩な表現の取り扱いが可能になったといえる。この点だけとると、当初の予定より進展しているといえるのだが、当初想定した通信路の符号化ではなく、情報源の符号化に近いものとなってしまっている点を差し引いている。しかし、この点については、今年度で分担者を外れることになった理論担当者も当初からたいていの問題は情報源の符号化でモデル化する方が自然である、との指摘と合致しており、符号理論の専門家が分担者から外れることなどを考慮すると、この方向で最終年度のまとめと、次の研究へ展開する方が妥当であるという結論に至った。
この経緯において、希少現象といっても、意図的な希少現象と意図的でない希少現象があることが明らかになった。意図的な希少現象という切り口は新奇性が高いものであり、希少現象ではあるが、サンプルを収集しやすい面もあるため、本課題はこの方向でまとめることが妥当であると考えている。また、この方向でまとめることにより、感情などといった主観的なアプローチが主だった「表現」研究の新しい方向の萌芽になると期待される。

Strategy for Future Research Activity

理論担当の分担者が分担をはずれることになったため、無限混合正規分布もしくはポワソン過程に基づく、意図して生成された希少現象の扱いを中心に、手法をさらに洗練させることで本課題をまとめる。
そのために、提案手法の音声表現への可能性を検討する。これまで声優の発話コーパスを整備してきたが、それに加え、「良い」プレゼンテーション中の「良い」表現(効果的な表現)を中心とする「表現音声コーパス」を整備し、提案手法を評価する。
また、音楽情報処理に関しては、リズム現象での意図的な逸脱である「グルーブ」を題材に提案手法を洗練させる予定である。
また、新たな分担者の担当である人間行動についても、提案手法が適用可能であるかどうかを検討し、さらなる発展の基礎としたい。

Expenditure Plans for the Next FY Research Funding

参加予定の国際会議に参加できなかったため。
提案手法の評価のための表現音声コーパスの構築、ならびその作業に必要なコンピュータおよび記憶装置を新たに予定に加える。

  • Research Products

    (5 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (3 results)

  • [Journal Article] 連続励起振動楽器を対象としたノート内セグメンテーション2014

    • Author(s)
      小泉悠馬,伊藤克亘
    • Journal Title

      電子情報通信学会論文誌

      Volume: J97-D Pages: .584,592

    • Peer Reviewed
  • [Journal Article] 擦弦楽器の意図表現合成のための奏法モデル2013

    • Author(s)
      小泉悠馬,伊藤克亘
    • Journal Title

      情報処理学会論文誌

      Volume: 54 Pages: 1319,1326

    • Peer Reviewed
  • [Presentation] Intra-note Segmentation via Sticky HMM with DP Emission2014

    • Author(s)
      Y. Koizumi,K. Itou
    • Organizer
      ICASSP-2014
    • Place of Presentation
      Firenze, Italy
    • Year and Date
      20140504-20140509
  • [Presentation] 奏者の意図したテンポ変動の推定に基づく演奏録音の自動伸縮修 正法2013

    • Author(s)
      小泉悠馬,伊藤克亘
    • Organizer
      FIT-2013
    • Place of Presentation
      鳥取大学
    • Year and Date
      20130904-20130906
  • [Presentation] Expressive Oriented Time-Scale Adjustment for Mis-played Musical Signals based on Tempo Curve Estimation2013

    • Author(s)
      Y. Koizumi,K. Itou
    • Organizer
      DAFx-13
    • Place of Presentation
      Maynooth, Ireland
    • Year and Date
      20130902-20130905

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi