2010 Fiscal Year Annual Research Report
統語的方法論による文脈自由言語および弱文脈依存言語の正例からの効率的極限同定
Project/Area Number |
20700124
|
Research Institution | Hokkaido University |
Principal Investigator |
吉仲 亮 北海道大学, 大学院・情報科学研究科, 学術研究員 (80466424)
|
Keywords | 計算論的学習 / 文法推論 / 形式言語理論 / 弱文脈依存言語 |
Research Abstract |
自然言語や生物配列においては文脈自由言語では記述できない複雑な現象が知られており,このような複雑な構造を扱うことが可能で,解析が容易な言語は弱文脈依存言語と呼ばれる.弱文脈依存言語を正例から効率的に学習するアルゴリズムを設計することは重要な課題であるが、研究開始時点では肯定的な成果はほとんど知られていなかった.本研究では近年の文脈自由言語族の学習に関する肯定的な結果を弱文脈依存言語へ適応し,学習アルゴリズムを一般化することを目指している. 昨年度までに,弱文脈依存言語の一種である多重文脈自由言語の特定の部分族が正例から効率的に学習可能であるとの結果を示していたが,平成22年度においては,この結果をさらに発展させ,学習者の学習情報資源として,正例に加え,教師に対し任意の文字列が正しい文であるか否か問い合わせることができるように拡張した場合に,正規言語や従来手法で学習可能であった文脈自由言語を真に含む,非常に豊かな言語族の学習が可能になることを示した.さらに,文脈自由文法と多重文脈自由文法の導出構造の類似点と相違点の分析を通じ,文脈自由言語族の学習アルゴリズムを多重文脈自由言語のそれへと翻訳する一般的な枠組みを提案した.さらに多重文脈自由言語に加え,他の弱文脈依存文法形式である文脈自由木言語などへの拡張を可能にするため,ラムダ計算を用いた抽象的かつ包括的な学習アルゴリズムを提案した.本研究は弱文脈依存言語族学習一般に関する極めて稀有かつ強力な肯定的結果をもたらした.
|