2013 Fiscal Year Research-status Report
出現頻度の偏った母集団の希少事象の認識のための通信路符号化モデルの構築
Project/Area Number |
24500215
|
Research Institution | Hosei University |
Principal Investigator |
伊藤 克亘 法政大学, 情報科学部, 教授 (30356472)
|
Co-Investigator(Kenkyū-buntansha) |
西島 利尚 法政大学, 情報科学部, 教授 (70211456)
|
Keywords | 音楽情報処理 / 逸脱 / 演奏表現 / 無限混合正規分布 |
Research Abstract |
今年度は、音楽情報処理に関しては、演奏表現の処理のために、逸脱と表現の関係を様々なレベルで明らかにした。特に、擦弦楽器の様々な演奏表現に対応できるような音符内状態推定の手法と、音声波形の音量軌跡をアーティキュレーションと呼ばれる局所的な音量変動による音符内での表現と、ダイナミクスと呼ばれる音符間にわたる大域的な表現に分離する手法を確立した。これらの研究を通じて、演奏表現ごとにさまざまに変化し、従来は上手く扱えなかった希少現象を無限混合正規分布を用いてモデル化することで、扱えるようにした。これらの研究より、印象的な表現(「よい」表現)は、高い技術を持った演奏者が意図的に行う逸脱であり、希少ではあるが、ある程度繰り返して用いられる(生成される)ことがわかった。 話者識別に関しては、ラジオ番組の話者を区別し話者ラベルを付与する、ダイアライゼーションに取り組んだ。一定の性能を示す手法は実現したが、希少現象が扱えないことよりも、話者識別においては、たいていのタスクで学習データが十分ではないことが問題であることが明らかになった。地道な取り組みが評価され、3月の情報処理学会全国大会では、学生奨励賞を受賞した。 音楽だけでなく、音声における表現という現象を解明するために、アニメーションの同一キャラクターを演じる異なる声優間での話者変換の研究を行った。第3話者コーパスを利用した変換という新しい手法を提案することで、異なるテキストを学習データとした話者変換を実現し、3月の情報処理学会全国大会では、学生奨励賞を受賞した。この研究では、一般的なイメージとは異なり、声の高さや発声方法などを大きく変化させる「表現」自体に、声優の個性がでるわけではなく、主として声質に個性が表れており、声質を変換することで一定の話者変換性能が達成された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
演奏者の意図から始めた音楽情報処理の研究を、演奏表現に的を絞り、さらに、その本質が「逸脱」にあることに着目し、それらをモデル化する過程で、希少現象のモデル化の方向性を確立させることができたといえる。このモデル化は、無限混合正規分布に基づいている。この無限混合正規分布は、ポワソン過程と関係が深く、この点から、希少現象を効果的にモデル化することで、多彩な表現の取り扱いが可能になったといえる。この点だけとると、当初の予定より進展しているといえるのだが、当初想定した通信路の符号化ではなく、情報源の符号化に近いものとなってしまっている点を差し引いている。しかし、この点については、今年度で分担者を外れることになった理論担当者も当初からたいていの問題は情報源の符号化でモデル化する方が自然である、との指摘と合致しており、符号理論の専門家が分担者から外れることなどを考慮すると、この方向で最終年度のまとめと、次の研究へ展開する方が妥当であるという結論に至った。 この経緯において、希少現象といっても、意図的な希少現象と意図的でない希少現象があることが明らかになった。意図的な希少現象という切り口は新奇性が高いものであり、希少現象ではあるが、サンプルを収集しやすい面もあるため、本課題はこの方向でまとめることが妥当であると考えている。また、この方向でまとめることにより、感情などといった主観的なアプローチが主だった「表現」研究の新しい方向の萌芽になると期待される。
|
Strategy for Future Research Activity |
理論担当の分担者が分担をはずれることになったため、無限混合正規分布もしくはポワソン過程に基づく、意図して生成された希少現象の扱いを中心に、手法をさらに洗練させることで本課題をまとめる。 そのために、提案手法の音声表現への可能性を検討する。これまで声優の発話コーパスを整備してきたが、それに加え、「良い」プレゼンテーション中の「良い」表現(効果的な表現)を中心とする「表現音声コーパス」を整備し、提案手法を評価する。 また、音楽情報処理に関しては、リズム現象での意図的な逸脱である「グルーブ」を題材に提案手法を洗練させる予定である。 また、新たな分担者の担当である人間行動についても、提案手法が適用可能であるかどうかを検討し、さらなる発展の基礎としたい。
|
Expenditure Plans for the Next FY Research Funding |
参加予定の国際会議に参加できなかったため。 提案手法の評価のための表現音声コーパスの構築、ならびその作業に必要なコンピュータおよび記憶装置を新たに予定に加える。
|