研究課題/領域番号 |
18K11150
|
研究機関 | 東北大学 |
研究代表者 |
吉仲 亮 東北大学, 情報科学研究科, 准教授 (80466424)
|
研究期間 (年度) |
2018-04-01 – 2024-03-31
|
キーワード | 文法推論 / 計算論的学習理論 / 無限アルファベット / 文脈自由文法 |
研究実績の概要 |
本研究課題は,近年の文脈自由言語に対する分布学習アプローチを発展させ,分布学習可能で一意標準形を持つ文脈自由言語族を探究することを目的としている.2022年度の成果の第一は,無限アルファベット上の文脈自由言語の学習に関するものである.古典的な有限アルファベット上の正則言語の学習手法を,シンボリックオートマトンと呼ばれる言語受理機械を用いて無限アルファベット上の正則言語の学習へと拡張した先行研究を参考にしつつ,正例から極限同定可能であることが知られていた可代入文脈自由言語を無限アルファベット上のそれへと拡張した際の学習可能性について考察した.その結果,文脈自由文法中の規則に現れる無限アルファベット上の概念クラスが学習可能であるだけでは不十分であるという否定的な結果を得る一方で,効率的な学習可能性を損なわない条件を発見し,正例から極限同定可能な無限アルファベット上の文脈自由言語族を見出す,世界初の結果となった.第二の成果は,分布学習アプローチ自体の一般化についてである.従来の文脈自由言語の分布学習では,いかなる文字列と文脈の結合が学習対象の言語に属する文字列を形成するか,という文字列と文脈の関係に焦点を当て,有限個の文脈が受理するような文字列で特徴づけ可能な非終端記号を学習するアプローチをとっていた.本研究ではこれを一般化し,文脈の受理する文字列集合に対するブール演算やスター演算を許した場合に,従来のアプローチでは学習できなかった多様な文脈自由言語が,所属性質問と正例から極限同定可能になることを示した.これらの成果は現在国際会議に投稿中で,査読を待っている状況である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究課題では文脈自由文法の非自明な部分族の標準形の合理的な定義を模索している.多様な学習可能性に関する結果が得られている点は十分な進捗といえるが,標準形に関して現在までのところ得られている成果は,文法サイズが指数的に大きくなるという意味で,否定的な結果にとどまっている.
|
今後の研究の推進方策 |
これまでに可代入文脈自由言語の単純な拡張であるk,l-可代入文脈自由言語族に対する文法の標準形が難しいという知見を得たが,文字列文法ではなく木文法等における可代入文脈自由言語について研究をすすめる.また,特にこれまでの研究期間で特に着目していた finite context property (FCP) は学習を可能にする制約ではあったが一意標準形を与えるにはまだ弱すぎるため,一意標準形を持つような制約について考案する.
|
次年度使用額が生じた理由 |
新型コロナウイルスの感染拡大の影響が長期化し,学会参加や研究協力者との研究打ち合わせが難しい状況になり,旅費に余剰が生じるとともに研究に遅れが生じた.その分,次年度には積極的に学会参加や研究協力者との議論を増やし,研究を推進し遅れを取り戻す.
|