2012 Fiscal Year Research-status Report
語句の分布情報を利用する形式言語学習理論に基づく実用的アルゴリズムの研究
Project/Area Number |
23700156
|
Research Institution | Kyoto University |
Principal Investigator |
吉仲 亮 京都大学, 情報学研究科, 助教 (80466424)
|
Keywords | 国際研究者交流(イギリス) / 文法推論 / 計算論的学習 / 弱文脈依存言語 / 非準線形言語 |
Research Abstract |
文法推論は形式言語の理論的な学習可能性と効率を追究する研究分野であるが,正則言語の学習に関する豊かな蓄積が応用分野にも影響を与えているのに対し,それを超える文脈自由言語等の学習に関しては肯定的な結果が少なく,応用分野へのインパクトは限定的であった.近年, Clark を中心とする研究者らによって,文中での語句の分布に基づいた学習の方法論が研究され,いくつかの文脈自由言語の部分クラスに対して効率的な学習アルゴリズムが提案されている.本研究では,このアプローチを深化させ,多様な応用分野に即したフォーマリズムに対して効率のよいアルゴリズムを提案することで,理論的な精度保証のある実用的なアルゴリズムに直結する理論的基盤を与えることを目指している. 平成24年度の成果の一つは,既存の分布学習手法を拡張し自然言語データからの学習を指向したより強力なアルゴリズムを提案したことである.従来の手法では学習できなかった,自然言語に見られる複雑な構造を並列多重文脈自由文法と呼ばれる形式言語を用いてモデル化し,この言語クラスを分布学習の手法で学習するアルゴリズムを設計しその理論的な正しさを証明した. また,確率的決定性有限状態機械を,ギブズサンプリングを用いたベイズ的学習手法によって推定するアルゴリズムを提案した.このアルゴリズムは PAutomaCというコンペティションで優勝し,その実用性の高さを実証している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
交付申請書には今年度の研究計画として,文脈自由言語を対象とした語句分布情報に基づく学習アルゴリズムを,より複雑な構造を扱う文法形式へと拡張することをうたったが,これについて,昨年度の単純文脈自由木文法への拡張に引き続き,導出において引数の複製を許す文脈自由木文法への拡張が可能になる条件を与えた.この点において,計画は順調に進められている.この拡張は,自然言語の意味表現を関連が深く,文字列と意味表現からの学習へと,人間の自然言語学習メカニズムのモデル化への発展的な研究に示唆的な結果となった. また,確率・統計的な手法を用いた確率的決定性有限状態機械の学習アルゴリズムは,コンペティションで高い成績を収めており,実用性の高いアルゴリズムである. これらから,総じて計画は順調に進んでいるものと考える.
|
Strategy for Future Research Activity |
平成24年度には,語句の分布情報に基づく学習の唱導者である A. Clark 博士をロンドンに訪ね,本課題研究に資する学問的な情報交換,議論討論を行ったが,平成25年度も引き続き折を捉えて同博士や関連研究者との議論を密にして研究を発展させていく. 平成24年度において,確率的な振る舞いをする環境下での有限状態機械の学習アルゴリズムを研究したが,平成25年度においてはこれを確率文脈自由文法の語句の分布情報を用いた学習へと発展させる.
|
Expenditure Plans for the Next FY Research Funding |
国際会議での成果発表のための旅費に加え,国内外の研究者との交流のため,訪問もしくは招聘のための費用に研究費の大きな部分を割く.この他,計算機実験のデータ整理用の計算機の購入も検討している.
|