2015 Fiscal Year Annual Research Report
ベイズ二重分節解析と深層学習の統合による教師なし言語獲得の構成論
Project/Area Number |
15H05319
|
Research Institution | Ritsumeikan University |
Principal Investigator |
谷口 忠大 立命館大学, 情報理工学部, 准教授 (80512251)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 言語獲得 / ノンパラメトリックベイズ / 深層学習 / 音声認識 / 記号創発 |
Outline of Annual Research Achievements |
初年度の研究課題として,ベイズ二重分節解析器と深層学習の統合モデルの開発に取り組んだ.本研究で対象とする教師なし言語獲得手法の開発のためには,ベイズ二重分節解析器(Nonparametric Bayesian Double Articulation Analyzer: NPB-DAA)の出力分布に適切な特徴ベクトルを受け取らせる必要がある.本研究では,深層学習器に音声時系列データから教師なし学習による表現学習を行わせ,適切な特徴ベクトルを抽出させるように学習させることを目的として研究を行った.初年度は深層学習器の一種であるDeep Sparse Auto Encoder (DSAE)を用いて教師なし学習により音声特徴量を抽出させることで,教師なし語彙学習の制度を向上させることを目指した. 具体的にはNPB-DAAとDSAEを結合させたNPB-DAA with DSAEを提案し.日本語話者に発生させた実母音系列からの単語獲得において既存手法をはるかに上回る性能を得た.この成果は, Tadahiro Taniguchi, Ryo Nakashima, Hailong Liu and Shogo Nagasaka, Double Articulation Analyzer with Deep Sparse Autoencoder for Unsupervised Word Discovery from Speech Signals, Advanced Robotics にて報告済みである.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の予定であった,ベイズ二重分節解析器と深層学習の統合モデルの開発に取り組んだところ,早期に結果を得ることが出来た.また,得られた結果は想定を上回る高性能なものであり,研究代表者のアプローチの正当性を裏付けるものであり,今後の研究の実施において重要な成果であると言える.さらに,当該内容を査読付き国際論文誌に投稿し,採録を得ることができた.
|
Strategy for Future Research Activity |
初年度は研究計画書に示した,1.ベイズ二重分節解析器と深層学習の統合モデルの開発,に関して大きな進捗を得ることが出来た.本内容に関しても,さらに理論的な発展を得るとともに,2. ベイズ二重分節解析器のサンプリングアルゴリズムの高速化,3. 限られた語彙を用いた単一話者の自然な音声発話からの教師なし言語獲得の実現,4. 環境・文脈の情報を用いた教師なし言語獲得の高精度化,5. 複数話者・大規模音声発話データからの教師なし言語獲得の実現,といった課題に関して研究を進めていく.
|
Research Products
(4 results)