研究課題/領域番号 |
18K11150
|
研究機関 | 東北大学 |
研究代表者 |
吉仲 亮 東北大学, 情報科学研究科, 准教授 (80466424)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 文法推論 / 文脈自由文法 / オートマトン |
研究実績の概要 |
本課題では,近年の文脈自由言語に対する分布学習アプローチの展開をさらに飛躍させ,分布学習可能で一意標準形を持つ文脈自由言語族を追究している.初年度においては,分布学習を可能にする文脈自由文法上の制約である 1-finite context property に対応する有限状態オートマトン上の制約である剰余 (residual) 性に注目し,従来の剰余オートマトンの学習を一般化し,剰余シンボリックオートマトン (residual symbolic automata) を多項式回数の質問によって学習するアルゴリズムを提案した.剰余オートマトンは決定性オートマトンよりも少ない状態で正則言語を表現可能であることが知られており,また,これとは別の有限状態オートマトンのコンパクトな表現としてシンボリックオートマトンが従来知られており,それぞれに質問学習アルゴリズムが提案されていた.そこで,本研究ではこれらを組み合わせた剰余シンボリックオートマトンを定義し,質問学習アルゴリズムを提案した.剰余シンボリックオートマトンでは,正則言語を非常に小さなオートマトンで表現可能である.構築するオートマトンが小さくなったことにともない,我々の学習アルゴリズムを用いることで,学習に必要な質問回数も少なくなり効率的な学習が可能になったことが,実験的にも確かめられた.なお,このアルゴリズムは,従来の剰余オートマトンの学習アルゴリズムの改良を含む.現在この成果をまとめ,投稿準備中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
剰余シンボリックオートマトンの学習アルゴリズムは,理論的に多項式回数の質問で目標を学習するのみならず,実験的にも効率が良いことが示されたのは期待以上の成果であった. 一方で,剰余シンボリックオートマトンは本質的には言語クラスに対する新しい標準表現形をもたらしたとは言えず,必ずしも本来の計画どおりには研究が進展していない面もある.
|
今後の研究の推進方策 |
文脈自由言語を学習にする文法に対する分布特性には多様なものが提案されており,2018年度に着目した 1-finite context property はそれらのうちのひとつである.次年度は,多様な分布特性に対応するオートマトン上の制約を考え,そのオートマトン族の性質や,学習アルゴリズムを設計する.また,これらの分布特性は学習を可能にする制約ではあったが一意標準形を与えるにはまだ弱すぎるため,これに適切な制約を課すことで,一意標準形を持つように設計する.
|
次年度使用額が生じた理由 |
当初,計算機の購入を予定していたが,本年度の研究の遂行にあたっては,既存の計算機で足りたため,購入を見送った.翌年以降に最新の設備を導入する予定である.
|