2011 Fiscal Year Annual Research Report
グラフ上に現れる記号列に対する文法処理手法の開発とその応用
Project/Area Number |
22700002
|
Research Institution | Ibaraki University |
Principal Investigator |
藤芳 明生 茨城大学, 工学部, 准教授 (00323212)
|
Keywords | 情報基礎 / 形式言語理論 / グラフ理論 / アルゴリズム / 数式OCR |
Research Abstract |
平成23年度は、理論研究として、ラベル選択付最小全域木問題を一般化したラベル選択付最小全域部分グラフ問題に取り組んだ。最小連結全域部分グラフ問題とは、各辺に「繋ぐ場合の重み」と「繋がない場合の重み」の2種類を与え、選ばれた辺の「繋ぐ場合の重み」の合計と選ばれなかった辺の「繋がない場合の重み」の合計の和が最小となるような連結全域部分グラフを求める問題である。ラベル選択付最小全域木問題がNP困難であるため、この問題を拡張したラベル選択付最小連結全域部分グラフ問題も同様にNP困難である。しかし、入力のグラフのtree-widthを2以下に制限した場合であれば、この問題が線形時間で解けることを示した。更に、線形時間で動作する非常にシンプルなアルゴリズムの提案を行った。この結果は数式OCRだけでなく、化学構造式OCR、化学構造式検索などに応用が可能である。 文法処理を行う上で、多くの認識候補が存在する場合、文法によってそれらの順序付けを行うことが必要になる。つまり、最適な認識候補を出力するための順位が必要となるのである。本研究では、ラベル選択付最小全域部分グラフ問題を解くことで、その順位付けを行うことを検討している。 また、応用研究として、昨年度までに開発された認識アルゴリズムと、数式OCR開発の経験と技術を応用し、化学構造式OCRの開発を行った。日本の公開特許公報中には多数の化学構造式が存在するが、現在、手作業での電子化作業が行われており、時間と費用が膨大なものとなっている。社会貢献の度合いは、数式OCRより化学構造式OCRの方が大きいのではないかと考え、開発の重点を化学構造式OCRにおくこととした。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
理論研究、応用研究、共に順調に成果を上げ、国際会議での発表を行い、学術誌論文への投稿も準備が進んでいる。
|
Strategy for Future Research Activity |
理論研究については、これまでと同様にグラフ上に現れる記号列に対する文法処理手法の開発を続けていく予定である。ここまで順調に業績を上げており、このままの方針で続ける。 応用研究については、数式OCRの開発は続けていくが、開発の重点を化学構造式OCRにおくこととした。社会貢献の度合いは、数式OCRより化学構造式OCRの方が大きいことが分かり、この方針転換を行った。数式OCRも化学構造式OCRも、必要な基礎技術はほぼ同一であり、この方針転換によって生じる問題点などは無いものと考える。
|