研究課題/領域番号 |
20300056
|
研究機関 | 電気通信大学 |
研究代表者 |
西野 哲朗 電気通信大学, 電気通信学部, 教授 (10198484)
|
研究分担者 |
富田 悦次 電気通信大学, 電気通信学部, 名誉教授 (40016598)
岡ノ谷 一夫 理化学研究所, 脳科学総合研究センター, チームリーダー (30211121)
田中 繁 理化学研究所, 脳科学総合研究センター, チームリーダー (70281706)
山崎 匡 理化学研究所, 脳科学総合研究センター, 研究員 (40392162)
|
キーワード | 計算論的学習理論 / 鳥の歌文法 / 文法学習 / 言語獲得 / 機械学習アルゴリズム / k可逆オートマトン / 正例からの学習 / ノイズ除去 |
研究概要 |
本研究の第一段階として、ソナグラムからの音素の切り出しを自動化した。具体的には、Wiener entropyや、frequency moduration等の特徴量を用いた音素の切り出し法や、音素のクラスタリング手法を確立し、その結果を用いて、音素の自動抽出プログラムを完成させた。 オートマトンAの状態遷移の向きを反転し、さらに、初期状態と最終状態を入れ替えて得られるオートマトンをAの逆オートマトンという。決定性有限オートマトンAの逆オートマトンも決定性有限オートマトンであるとき、AをO可逆オートマトンと呼ぶ。O可逆オートマトンにより受理される言語をO可逆言語という。さらに、k文字先読みを許せば、Aの逆オートマトンが存在するとき、Aをk可逆オートマトンという。Angluinは、与えられた正例の集合から、それを受理する最小状態数のk可逆オートマトンを、多能式更新時間で極限同定する機械学習アルゴリズムを示した。ここで正例とは、目標の言語に属する記号列のことである。ジュウシマツの歌を目標の言語と考える場合には、うたい間違いの無い歌のサンプルが正例となる。 本研究では、Angluinの学習アルゴリズムの入力として、ノイズのまったく無い完全な歌データを仮定することは現実的ではないので、なんらかのノイズ対策を考える必要がある。ジュウシマツによるノイズや、人為的なノイズは、正しい状態遷移に比べれば、出現頻度は非常に小さいはずである。そこで、音素間の状態遷移確率を計算し、ある設定値以下の遷移をノイズとして削除した。また、音素間の遷移だけでなく、データの末尾であることも遷移の一つと考えることにより、歌を途中で止めてしまったというノイズにも対応できるようにした。
|