2007 Fiscal Year Annual Research Report
弱文脈依存に属する形式文法の性質の解明と高速な認識アルゴリズムの開発
Project/Area Number |
17700004
|
Research Institution | Ibaraki University |
Principal Investigator |
藤芳 明生 Ibaraki University, 工学部, 講師 (00323212)
|
Keywords | 形式言語理論 / 認識アルゴリズム / Tree Adjoining Grammar / 文脈自由木文法 / プッシュダウン木オートマトン / Spine Grammar / 構文解析 |
Research Abstract |
本研究は、Tree Adjoining Grammar(TAG)に代表されるような木構造を生成する木文法に注目し、弱文脈依存に属する形式文法の性質を解明すると共に高速な認識アルゴリズムの開発を行うことを目的としている。特に、TAGと同じ文字列言語のクラスを生成するSpine GrammarおよびLinear Monadic Context-Free Tree Grammarに注目して、研究を進めている。 今年度は、前年度に開発した、入力の大きさの3乗のオーダーでLinear Monadic Context-Free Tree Grammarの生成する木構造を認識するアルゴリズムの応用を行った。具体的には、数式OCRの認識精度を向上させるため、OCRに認識結果の検証アルゴリズムの開発を行った。開発したアルゴリズムは様々な高速化の工夫を行い、大変高速に動作する。数学論文のデータベースを利用し、評価実験を行い、本研究が開発したアルゴリズムの有効性を確認することができた。 また、決定性・線形プッシュダウン木オートマトンに注目し、それが受理する言語のクラスについて研究を行った。まず、3つの決定性・線形プッシュダウン木オートマトンのバリエーションの定義を行った。それら3つの決定性・線形プッシュダウン木オートマトンが受理する木構造の言語のクラスについて階層が存在すること、また、対応するイールド言語のクラスについては、すべてが一致し、さらには非決定性のものとも一致することが証明された。
|