2009 Fiscal Year Annual Research Report
統語的方法論による文脈自由言語および弱文脈依存言語の正例からの効率的極限同定
Project/Area Number |
20700124
|
Research Institution | Hokkaido University |
Principal Investigator |
吉仲 亮 Hokkaido University, 大学院・情報科学研究科, 博士研究員 (80466424)
|
Keywords | 計算論的学習 / 文法推論 / 形式言語理論 / 弱文脈依存言語 |
Research Abstract |
自然言語や生物配列においては文脈自由言語では記述できない複雑な現象が知られており、このような複雑な構造を扱うことができながら、解析が容易な言語は弱文脈依存言語と呼ばれる。弱文脈依存言語を正例から効率的に学習するアルゴリズムを設計することは重要な課題であるが、研究開始時点では肯定的な成果はほとんど知られていなかった。Clark & Eyraud(JMLR 2007)は、可代入性と呼ばれる性質を満たす文脈自由言語の部分クラスが多項式時間で正例から学習可能であることを示していた。本研究は彼らの方法論を一般化し、閉包特性と学習効率との間の一般的な関係を特徴づけることを目指している。 特に平成21年度においては、弱文脈依存言語の学習について研究した。文脈自由言語における可代入性が、正規言語における可逆性の類比として捉えられたように、多重文脈自由言語に対して多次元可代入性の概念を提唱した。各自然数pに対してp次元可代入性という制約を与え、この階層構造に対応する多重文脈自由言語の部分クラスは全て効率的に学習可能であることを証明した。多重文脈自由言語は、最も代表的な弱文脈依存言語であり、本研究成果はこのクラスに関する効率学習の極めて稀有な例となった。 また、多重文脈自由言語の形式的性質に関する研究を進め、文脈自由言語において成立していた表現定理および生成定理(Chomsky-Schutzenbergerの定理)が、多重文脈自由言語においても成立することを示した。
|
Research Products
(1 results)