2014 Fiscal Year Annual Research Report
出現頻度の偏った母集団の希少事象の認識のための通信路符号化モデルの構築
Project/Area Number |
24500215
|
Research Institution | Hosei University |
Principal Investigator |
伊藤 克亘 法政大学, 情報科学部, 教授 (30356472)
|
Co-Investigator(Kenkyū-buntansha) |
西島 利尚 法政大学, 情報科学部, 教授 (70211456) [Withdrawn]
廣津 登志夫 法政大学, 情報科学部, 教授 (10378268)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 音声情報処理 / 音楽情報処理 / 表現 / 認識 / 強調 / アーティキュレーション / HDP-HMM |
Outline of Annual Research Achievements |
これまで2年間の研究成果を踏まえて、意図した希少表現のモデル化という観点で本課題のまとめを行った。音楽情報処理については、擦弦楽器の多彩で繊細な表現力の基盤となるアーティキュレーションの分析のための音符内での状態推定についてまとめた。多彩な表現のプリミティブはやはり多彩であり、学習データによる学習は不向きである。しかし、逆に同一の曲内では、局所的に同一のプリミティブが出現する。その現象を sticky HDP-HMM で表現することで、学習データなしに、音符内での状態推定を可能にした。 音楽情報処理では、他に、グルーブと呼ばれる、ポピュラー音楽のリズムにおける逸脱現象についてモデル化を試みた。しかし、グルーブでは、確かに、周期的なリズムからの逸脱はあるが、その逸脱は周期的に生じるものであり、ゆらぎも小さいため、本課題で対象としている逸脱とは異なる種類の逸脱であるとの結論を得た。 音声情報処理では、講演などにおける強調現象について取り組んだ。日本語の講演を対象とした場合、うまく強調できているデータはそれほど多くはない。そこで、強調が上手い話者のデータを対象に強調表現を分析したところ、3つのタイプの強調表現が観測された。一つは、強調したい単語のアクセントの部分の高さを通常よりも高くするタイプ。他の二つは、強調したい単語を強く発声する、その単語の前後にポーズをおくというものであった。これらは、組み合わせて用いるというよりは、使い分けている印象であった。しかし、収集したデータが不十分だったため、どのように使い分けているかは不明であった。アクセントに関しては、学習データからアクセント成分を自動で分離し、アクセント成分の強さをモデル化することで、任意の発話音声の任意の単語を強調しているように聞こえるように修正することに成功した。
|