研究課題/領域番号 |
17700004
|
研究種目 |
若手研究(B)
|
配分区分 | 補助金 |
研究分野 |
情報学基礎
|
研究機関 | 茨城大学 |
研究代表者 |
藤芳 明生 茨城大学, 工学部, 講師 (00323212)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
2,500千円 (直接経費: 2,500千円)
2007年度: 600千円 (直接経費: 600千円)
2006年度: 900千円 (直接経費: 900千円)
2005年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | 形式言語理論 / 認識アルゴリズム / Tree Adjoining Grammar / 文脈自由木文法 / プッシュダウン木オートマトン / Spine Grammar / 構文解析 |
研究概要 |
本研究は、Tree Adjoining Grammar(TAG)に代表されるような木構造を生成する木文法に注目し、弱文脈依存に属する形式文法の性質を解明すると共に高速な認識アルゴリズムの開発を行うことを目的としている。特に、TAGと同じ文字列言語のクラスを生成するSpine GrammarおよびLinear Monadic Context-Free Tree Grammarに注目して、研究を進めている。 今年度は、前年度に開発した、入力の大きさの3乗のオーダーでLinear Monadic Context-Free Tree Grammarの生成する木構造を認識するアルゴリズムの応用を行った。具体的には、数式OCRの認識精度を向上させるため、OCRに認識結果の検証アルゴリズムの開発を行った。開発したアルゴリズムは様々な高速化の工夫を行い、大変高速に動作する。数学論文のデータベースを利用し、評価実験を行い、本研究が開発したアルゴリズムの有効性を確認することができた。 また、決定性・線形プッシュダウン木オートマトンに注目し、それが受理する言語のクラスについて研究を行った。まず、3つの決定性・線形プッシュダウン木オートマトンのバリエーションの定義を行った。それら3つの決定性・線形プッシュダウン木オートマトンが受理する木構造の言語のクラスについて階層が存在すること、また、対応するイールド言語のクラスについては、すべてが一致し、さらには非決定性のものとも一致することが証明された。
|