研究実績の概要 |
文脈自由言語の分布学習アルゴリズムでは,文法の非終端記号に対して,所属性質問によって判定できるような文字列集合を割り当てる。従来の研究では,有限個の所属性質問の論理積によって表せるような文字列集合を割り当てていた。2021年度までの本研究によって,論理積を任意のブール結合に一般化しても,従来のものと同様のアルゴリズムにより,学習が成り立つことがわかった。これによって,学習の目標とすることができる文脈自由言語のクラスが広がった。
2022年度の研究で,この結果をさらに大きく一般化することができた。この一般化では,文法の各非終端記号は,所属性質問に対応する原子式を含む一種の拡張正規表現で表される。所属性質問に対応する原子式は,文字列のペア(u,v)で表され,目標言語Lの商集合{ x | uxv in L }を意味する。拡張正規表現では,通常の正規表現で使える演算に加えて,補集合演算や共通部分演算も許される。非終端記号に割り当てることができる文字列集合のクラスは,目標言語の商集合からなるクラスの拡張正規閉包(つまり,目標言語の商集合をすべて含み,正規演算とブール演算について閉じている最小のクラス)ということになる。
この一般化によって学習の目標とすることができる文脈自由言語のクラスがさらに広がったが,このクラスの性質についてはまだよくわかっていない。このクラスに属さない単純な文脈自由言語を示すことはできたが,この言語は本質的に曖昧な文脈自由言語である。本質的に曖昧でない言語でこのクラスに属さない文脈自由言語の例はまだ見つかっていない。もう一つの重要な未解決問題として,クリーニスター演算をのぞいた演算のみを許した場合,学習の目標とできる文脈自由言語のクラスは変わるのかという問題がある。
|