本研究課題では,文脈自由言語をアルゴリズム的に学習する技法として近年盛んに研究され成功を収めている「分布学習」とよばれるアプローチを,自然言語学習の素朴な数理モデルとしての文と意味表現の対の学習へと発展させることを目的としている. 平成29年度の研究成果は以下の通りである.まず,ゼロサプレス型二分決定図 (ZDD) と呼ばれる,集合族を表現するデータ構造の効率的な質問学習アルゴリズムを設計した.ZDDは極めて特殊な性質を持った決定性有限状態機械と見ることができるため,古典的な正則言語に対する学習アルゴリズムを適用して学習することも可能であるが,その特殊な性質に着目することで,より効率の良い学習アルゴリズムが可能であることを示した.類似の先行研究に(ゼロサプレス型でない)二分決定図 (BDD) に対する効率的な質問学習の成果があったが,ZDDはより決定性有限状態機械に近い性質を持っており,形式言語の学習アルゴリズムの理解を深め発展させるためにはより適切な対象と考えられるデータ構造である.成果は査読付き国際会議 Algorithmic Learning Theory 2017 で発表された.また,文脈自由文法を分布学習可能にする諸条件のひとつに k-FCP と呼ばれる概念があるが,これを決定性有限状態機械の制約として捉え直すことで,有限状態機械の新しい標準形を定義し,それに対する多項式時間質問学習アルゴリズムを設計した.現在成果の発表を準備中である.
|