Application of Nonparametric Bayesian Methods to Distributional Learning
Project/Area Number |
26730123
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Multi-year Fund |
Research Field |
Intelligent informatics
|
Research Institution | Tokyo University of Technology |
Principal Investigator |
SHIBATA Chihiro 東京工科大学, コンピュータサイエンス学部, 講師 (00633299)
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Project Status |
Completed (Fiscal Year 2018)
|
Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2017: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2016: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2015: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2014: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
|
Keywords | 機械学習 / 自然言語処理 / 構文解析 / ノンパラメトリックベイズ / 統計的学習 / ベイズ学習 / 教師なし学習 / 形式言語理論 / リカレントニューラルネットワーク / 並列分散処理 / Distributional Learning / Nonparametric Bayes / Learning Theory / Grammar Learning |
Outline of Final Research Achievements |
Based on the basic idea of distributed learning, we propose a grammatical structure with (k, l)-context-dependent probabilities using a hierarchical nonparametric Bayesian model called Hierarchical Pitman-Yor Processes. At the same time, a fast MCMC method for the estimation is proposed. In experiments, it was shown that high prediction accuracy could be obtained. As a final result, we developed the algorithms for improving the accuracy of unsupervised parsing.
|
Academic Significance and Societal Importance of the Research Achievements |
近年の深層学習の発展により,自然言語処理の分野においても,様々なことが加速度的に可能となってきている.例えば,機械翻訳がその代表的な例である.一方で,現在の手法では,大量の教師ありのデータを必要とする.構文解析であれば,構文木を含む構文情報が付与された文のセットが必要となる.本研究成果は,構文木など教師となるものがまったくなくても,構文解析を統計的な学習手法を用いて行うものであり,特に,確率文脈自由文法の学習の観点から見て,より制度の高い確率構造と学習アルゴリズムを新規に提案している.
|
Report
(6 results)
Research Products
(19 results)