一意標準形文法をもつ文脈自由言語族およびその学習に関する研究
Project/Area Number |
18K11150
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60010:Theory of informatics-related
|
Research Institution | Tohoku University |
Principal Investigator |
吉仲 亮 東北大学, 情報科学研究科, 准教授 (80466424)
|
Project Period (FY) |
2018-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2019: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2018: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 文法推論 / 計算論的学習理論 / 無限アルファベット / 文脈自由文法 / 有限状態オートマトン / オートマトン / 文脈自由言語 / 分布学習 / 正則言語 |
Outline of Annual Research Achievements |
本研究課題は,近年の文脈自由言語に対する分布学習アプローチを発展させ,分布学習可能で一意標準形を持つ文脈自由言語族を探究することを目的としている.2022年度の成果の第一は,無限アルファベット上の文脈自由言語の学習に関するものである.古典的な有限アルファベット上の正則言語の学習手法を,シンボリックオートマトンと呼ばれる言語受理機械を用いて無限アルファベット上の正則言語の学習へと拡張した先行研究を参考にしつつ,正例から極限同定可能であることが知られていた可代入文脈自由言語を無限アルファベット上のそれへと拡張した際の学習可能性について考察した.その結果,文脈自由文法中の規則に現れる無限アルファベット上の概念クラスが学習可能であるだけでは不十分であるという否定的な結果を得る一方で,効率的な学習可能性を損なわない条件を発見し,正例から極限同定可能な無限アルファベット上の文脈自由言語族を見出す,世界初の結果となった.第二の成果は,分布学習アプローチ自体の一般化についてである.従来の文脈自由言語の分布学習では,いかなる文字列と文脈の結合が学習対象の言語に属する文字列を形成するか,という文字列と文脈の関係に焦点を当て,有限個の文脈が受理するような文字列で特徴づけ可能な非終端記号を学習するアプローチをとっていた.本研究ではこれを一般化し,文脈の受理する文字列集合に対するブール演算やスター演算を許した場合に,従来のアプローチでは学習できなかった多様な文脈自由言語が,所属性質問と正例から極限同定可能になることを示した.これらの成果は現在国際会議に投稿中で,査読を待っている状況である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究課題では文脈自由文法の非自明な部分族の標準形の合理的な定義を模索している.多様な学習可能性に関する結果が得られている点は十分な進捗といえるが,標準形に関して現在までのところ得られている成果は,文法サイズが指数的に大きくなるという意味で,否定的な結果にとどまっている.
|
Strategy for Future Research Activity |
これまでに可代入文脈自由言語の単純な拡張であるk,l-可代入文脈自由言語族に対する文法の標準形が難しいという知見を得たが,文字列文法ではなく木文法等における可代入文脈自由言語について研究をすすめる.また,特にこれまでの研究期間で特に着目していた finite context property (FCP) は学習を可能にする制約ではあったが一意標準形を与えるにはまだ弱すぎるため,一意標準形を持つような制約について考案する.
|
Report
(5 results)
Research Products
(14 results)