研究課題/領域番号 |
26730123
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京工科大学 |
研究代表者 |
柴田 千尋 東京工科大学, コンピュータサイエンス学部, 講師 (00633299)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2017年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2016年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2015年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2014年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | 機械学習 / 自然言語処理 / 構文解析 / ノンパラメトリックベイズ / 統計的学習 / ベイズ学習 / 教師なし学習 / 形式言語理論 / リカレントニューラルネットワーク / 並列分散処理 / Distributional Learning / Nonparametric Bayes / Learning Theory / Grammar Learning |
研究成果の概要 |
Distributional Learning の基本的な考えに基づき,Hierarchical Pitman-Yor Processesと呼ばれる階層化ノンパラメトリックベイズのモデルを用い, (k,l)-文脈依存確率をもつ文法構造を提案した.また,同時に,推定のための高速なMCMC手法を提案した.実際に実験を通して,高い予測精度を得ることができることを示した.最終的な成果として,教師なし構文解析の高精度化のためのアルゴリズムを開発することができた.
|
研究成果の学術的意義や社会的意義 |
近年の深層学習の発展により,自然言語処理の分野においても,様々なことが加速度的に可能となってきている.例えば,機械翻訳がその代表的な例である.一方で,現在の手法では,大量の教師ありのデータを必要とする.構文解析であれば,構文木を含む構文情報が付与された文のセットが必要となる.本研究成果は,構文木など教師となるものがまったくなくても,構文解析を統計的な学習手法を用いて行うものであり,特に,確率文脈自由文法の学習の観点から見て,より制度の高い確率構造と学習アルゴリズムを新規に提案している.
|