2015 Fiscal Year Research-status Report
分布学習に基づく自然言語文とその意味表現の対からなる形式言語の学習に関する研究
Project/Area Number |
26330013
|
Research Institution | Kyoto University |
Principal Investigator |
吉仲 亮 京都大学, 情報学研究科, 助教 (80466424)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 計算論的学習理論 / 文法推論 |
Outline of Annual Research Achievements |
本研究課題では,近年文脈自由言語をアルゴリズム的に学習する技法として盛んに研究され成功を収めている「分布学習」とよばれるアプローチを,自然言語学習の素朴な数理モデルとしての文とラムダ項の対の学習へと発展させることを目的としている. 平成27年度は,主に3つの課題に取り組み,成果を得た. 1つは,分布学習が適応可能な文法形式一般に関する議論である.これまで文脈自由文法やその一般化とみなせるような多重文脈自由文法,文脈自由木文法といった各種の文法それぞれについて,分布学習概念が適用され議論されてきた.これに対して本研究代表者は,分布学習概念を適用可能な文法形式について一般的抽象的な枠組みを与えた.このような枠組みは,本課題で対象としている,文字列とラムダ項の対という特殊な数学オブジェクトに対しても有効であり,分布学習がいかに定義され議論されるべきか良い見通しを与えた.本成果は,The 14th Meeting on Mathematics of Linguistics の招待講演において発表された. また1つは,非線形ラムダ項を用いた文法形式について,分布学習が部分的に可能となる特殊ケースの条件に関する事例的成果である.非線形性は分布学習を計算量的に困難にする要因であるが,文脈構造か部分構造の一方が非線形度が定数で抑えられる場合には,分布学習が部分的に可能である.そのような導出構造を与える文法規則の条件について考察した.成果は Formal Grammar 2015 において発表された. さらに,非線形度が定数で抑えられない文法であっても,文脈構造と部分構造への分解が多項式時間で可能である場合を発見した.並列正則木文法がこのような性質を持っていること,さらに一般化した文脈自由木文法について,このような性質を持つ部分クラスが定性的に定義可能であることを証明した.本成果に関する論文は Fandamenta Informaticae に投稿した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題における3つの主要な技術的課題のうち,(a) 構造分解の探索空間の爆発について,非線形文法でも探索空間が爆発しない場合があることを示し,当初想定した以上の大きな成果を得ることができた.特に木文法に関する知見は,一般の非線形ラムダ項に基づく文法における多項式時間構造分解を追究する上での重要なヒントになるだろう.一方で,オブジェクト対からなる言語の学習については関連研究者と議論をはじめた段階にとどまっている.
|
Strategy for Future Research Activity |
翌年度はオブジェクト対からなる言語の学習を中心に研究をすすめる.
|
Causes of Carryover |
研究成果の1つが,学会の招待講演として発表することとなったため,海外発表費用については先方会議の負担となり,科研費を節約することができた.
|
Expenditure Plan for Carryover Budget |
より一層の国際的な研究を推進するため,海外研究者との打ち合わせを増やす.
|