研究課題/領域番号 |
20J23184
|
研究機関 | 東京工業大学 |
研究代表者 |
宮嵜 貴之 東京工業大学, 情報理工学院, 特別研究員(DC1)
|
研究期間 (年度) |
2020-04-24 – 2023-03-31
|
キーワード | 形式言語理論 / 構文解析 / 先読み / 解析表現文法 / 文脈自由文法の微分 |
研究実績の概要 |
当初から予定していた先読み付き文脈自由文法の導入を行った。先読み付き文脈自由文法は肯定先読みと否定先読みを持つ文法であり、否定先読みのようなネガティブな演算を導入すると、文法を言語の連立方程式であると見た際に解が存在しないような文法が記述できてしまうという問題がある。そのような問題に対して、すべての文法ではなく、ある意味でまともな文法に絞って意味論を与えることにした。先読み付き文脈自由文法の意味論は、以前の先読み付き正規表現の研究で得た文字列の組の集合である先読み付き言語と、補集合と共通部分演算を持つ文法であるBoolean grammarの研究からアイディアを得た空集合からの反復の極限の2つを組み合わせることによって形式化した。その上で形式言語理論の中心的な概念の一つである文脈自由文法と実用的によく利用されている解析表現文法の両者の拡張となることを証明した。また、いくつかの閉包性や決定可能性などの基本的な性質や表現力について研究を行なった。閉包性については、先読み付き言語の閉包性と言語の閉包性の2種類を考える必要がある。言語の閉包性において、共通部分と補集合に閉じていることを示した。また、言語の閉包性に関して、連接とクリーネ閉包に対する閉包性が非自明である点でBoolean grammarなどの文法とは異なる性質が見られている。表現力については、共通部分と補集合を表せるため、文脈自由を超えるが、さらに文脈自由言語の補集合閉包を超える。これは再帰があるため、ある種の無限回の補集合演算を行えることを表している。単純な文法で、あるkに対して、kのn乗の長さの文字列全体を表すことができる。その他の結果として、代入の逆の操作が行えないケースがあるということがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
得られた結果は国際会議にて発表を行った。本研究において重要な先読み付き文脈自由文法の導入を行うことが出来たため、期待通り研究が進捗したと考えている。
|
今後の研究の推進方策 |
現状の先読み付き正規表現の意味論は、標準形への変換についての議論を行う際に適切な意味論ではない可能性があることが、いくつかの例を観察するうちに分かってきた。また、国際会議の査読者のおかげで、関連する重要な文献を知り、新たな方向性の研究が必要であることがわかってきた。その文献では、関連する文法であるBoolean grammarに対して、3値論理を応用した3値言語という概念を導入することで、すべての文法に解が存在することが示されている。この手法は本質的であるため、先読み付き文脈自由文法の研究においても有用であると考えており、この手法を応用して意味論を与えることで、標準形への変換等についての議論を行なっていくことを考えている。標準形への変換では、通常、空文字列の除去を行うが、先読み付き文脈自由文法では、その意味での空文字列に対するものが無限にあるため、Boolean grammarなどの文法の手法をそのまま応用すれば良いというわけではなく、その解決については課題が残っている。また、先読み付き文脈自由文法の所属判定または構文解析のアルゴリズムとして、先読み付き文脈自由文法の微分によるアルゴリズムを考えている。これは、以前の先読み付き正規表現の微分に対する研究と文脈自由文法の微分を参考にして得ることができる。この研究については、アルゴリズムの計算量についての証明が現在研究中である。この証明は当初予想していなかった代入の逆の操作が行えない場合があるという問題点が生じたことや、標準形への変換を議論する難しさの影響から難航したが、いくつかの必要な研究を行えば可能であると考えている。
|