2021 Fiscal Year Annual Research Report
実用的な構文解析技術と形式言語理論をつなぐ統一的な理論基盤の構築
Project/Area Number |
20J23184
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
宮嵜 貴之 東京工業大学, 情報理工学院, 特別研究員(DC1)
|
Project Period (FY) |
2020-04-24 – 2023-03-31
|
Keywords | 形式言語理論 / 構文解析 / 先読み / 解析表現文法 / 文脈自由文法の微分 / プログラム意味論 |
Outline of Annual Research Achievements |
昨年度に導入した先読み付き文脈自由文法の意味論には、基本的な文法の変換操作である代入の逆の操作が行えない場合があり、標準形への変換についての議論や認識アルゴリズムの計算量の解析が困難であるという問題があった。本年度はその問題を解決する手法として3値の意味論を用いた定式化を得た。これは、文字列の組から真、偽、未定義への写像である3値の先読み付き言語を考え、それらの間に未定義を最小とする順序を入れ、その順序の下での最小解を考えるというものである。この方法は、プログラムの表示的意味論において標準的な方法であり、論理プログラミングにおいてはFittingの意味論と呼ばれている。3値の意味論によって、全ての文法を扱うことができ、代入の逆の操作を自由に行うことができることが分かった。この新たな意味論の下でも、文脈自由文法と解析表現文法の両者の拡張となること、補集合の閉包性を除く閉包性や決定可能性などの基本的な性質、表現力についての結果が成り立つことを証明した。次に、先読み付き文脈自由文法の認識アルゴリズムに関して、微分による認識アルゴリズムを与え、その計算量の解析を行った。その結果として、そのアルゴリズムは、入力文字列の長さn、先読み付き文脈自由文法の大きさ|G|に対し、時間計算量O(n^3 |G|)、空間計算量O(n^2 |G|)で計算可能であることが分かった。これは文脈自由文法に対して得られている結果と同じであるが、先読みの持つ性質の違いによって証明は少し異なり、また、その性質の違いから行列乗算の計算量であるValiant法は先読み付き文脈自由文法に適用することができないことがわかる。最後に、表現力に関して、先読み付き文脈自由文法でk項間漸化式を模倣する方法を発見し、多項式pに対してp(n)の長さからなる文字列全体を表す言語を記述できるという結果を新たに得た。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
国際会議への投稿を試みたが、採択に至っておらず、まだ発表を行えていない。形式言語理論とプログラム意味論という2つの異なる分野を基礎とした研究であるため、結果を分かりやすく提示する工夫が必要であると考えている。
|
Strategy for Future Research Activity |
今後の研究の方向性として、いくつかの残された課題について研究を進める。まず、Chomsky標準形やGreibach標準形などの標準形への変換が可能であるか、また、特に唯一解を持つ文法への変換が可能であるかという問題が課題として挙げられる。これは補集合に対する閉包性が新たな意味論の下で成り立つかという問題とも関連している。また、別の意味論として、否定先読みの入れ子がない場合にはwell-founded意味論と呼ばれる意味論を適用することも考えられる。これは共通部分演算と補集合演算を加えた文法であるBoolean grammarで用いられているため比較する必要があり、2つの意味論の下で言語クラスが同じであるかなどの検討が必要である。また他の課題として、解析表現文法や一方向文脈付き文脈自由文法との詳細な比較、認識および構文解析アルゴリズムの実装が挙げられる。
|