これまで研究を行ってきた数式認識手法について、以下の点でさらに検討を行なった。 (1)記号・文字同士の接触を切り離すためのアルゴリズムの改良 (2)数式認識精度の向上と性能評価 (3)数学文献中の引用文献の解析と認識 項目(1)については研究代表者の岡本と分担者の鈴木が独自に検討を行ない、これまでのアルゴリズムの改良を行った。この結果、岡本の開発した新手法では、記号・文字同士の接触検出と切り離し精度が従来のものに比べかなり向上した。鈴木は同一種類の数学文献中には、類似の接触パターンが繰り返し現われることに注目し、一度の切り離し操作で類似の接触パターンも自動的に切り離す手法を開発した。この成果により、実際に数学文献を電子化する際に必要となる人間による修正作業の大幅な減少をはかることができる。(2)については、岡本が主に担当し、数式認識手法の改良を行った。またその精度向上を定量的に調べるため、認識対象文献を大幅に拡充すると共に、回答データベースとなるGround Truthを作成し、自動的に数式認識精度を計測するツールを作成した。(3)については主に鈴木が担当し、引用文献部分の著者、論文タイトル、文献名(巻・号等を含む)、ページ、発行年等の解析、認識を行う手法を開発した。これらの研究成果は7th International Conference on Document Analysis and Recognition(Edinburgh)他、幾つかの研究会で発表した。
|