研究課題/領域番号 |
18K11150
|
研究機関 | 東北大学 |
研究代表者 |
吉仲 亮 東北大学, 情報科学研究科, 准教授 (80466424)
|
研究期間 (年度) |
2018-04-01 – 2025-03-31
|
キーワード | 文法推論 / 計算論的学習理論 / 有限状態オートマトン / 文脈自由文法 |
研究実績の概要 |
本研究課題は,近年の文脈自由言語に対する分布学習アプローチを発展させ,分布学習可能でありかつ一意標準形を持つ文脈自由言語族を探究することを目的としている.従来の形式言語学習では,アルファベットサイズが有限であるものを想定した研究が中心であったのに対して,本研究課題では,2023年度は,無限アルファベット上の正則言語学習と文脈自由言語学習について考察を深め,成果を上げた.正則言語学習にあっては,質問による古典的な厳密学習を発展させ,質問に対する回答が完全に文字列を2値分類しない場合の学習に関する研究がいくつか知られていた.本研究課題では無限アルファベット上の正則言語学習においてどのような困難があるか考察し,ひとつの解決を与えた.本結果は査読付き国際会議SPIRE2024にて発表された. また,2022年度は無限アルファベット上の文脈自由言語の正例からの極限同定について考察したが,これを発展させ,質問学習の舞台へと移すべく研究を進めた.形式言語学習のアプローチはいくつかあるが,その中で,分布学習アプローチが無限アルファベット上の形式言語の学習と親和性が高いことがわかってきた.この知見に基づき,合同性文脈自由言語と呼ばれるひとつの文脈自由言語の部分族についての質問学習アルゴリズムのプロトタイプを作成した.詳細を完成させ,さらに関連の言語族の学習に関しても考察し,これらを国際的な発表とする予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究課題では文脈自由文法の非自明な部分族の標準形の合理的な定義を模索している.多様な学習可能性に関する結果が得られている点は十分な進捗といえるが,標準形に関して現在までのところ得られている成果は,文法サイズが指数的に大きくなるという意味で,否定的な結果にとどまっている.
|
今後の研究の推進方策 |
これまでに可代入文脈自由言語の単純な拡張であるk,l-可代入文脈自由言語族に対する文法の標準形が難しいという知見を得たが,文字列文法ではなく木文法等における可代入文脈自由言語について研究をすすめる.また,特にこれまでの研究期間で特に着目していた finite context property (FCP) は学習を可能にする制約ではあったが一意標準形を与えるにはまだ弱すぎるため,一意標準形を持つような制約について考案する.
|
次年度使用額が生じた理由 |
新型コロナウイルスの感染拡大の影響が予想よりも長期化し,学会参加や研究協力者との研究打ち合わせがほとんどできない状況になり,旅費に余剰が生じるとともに研究に遅れが生じた.その分,次年度には積極的に学会参加や研究協力者との議論を増やし,研究を推進し遅れを取り戻す.
|