研究分担者 |
岩元 隆 福岡教育大学, 教育学部, 助教授 (30232713)
桑野 博 福岡教育大学, 教育学部, 助教授 (50036886)
上村 英樹 福岡教育大学, 教育学部, 教授 (00036906)
藤本 光史 福岡教育大学, 教育学部, 講師 (20270241)
白石 正人 福岡教育大学, 教育学部, 助教授 (70216183)
|
研究概要 |
数式を認識するOCRはまだ実用化されていない.主な理由として, 1.数式は2次元的に配置され,構造を解析することが難しい. 2.数式は積分記号,総和記号,根号記号など比較的大きな文字から2重,3重の添字など小さな文字まである. 3.数式を多く扱う者が数学を専門にしているものに限り,OCRとして市場のニーズが余りない. 以上の理由により,企業も数式認識の大切さは,理解出来てもなかなか本格的な研究をおこなってくれない.そこで,我々は大学に籍を置き,数学を専門にしている者と情報に関心のある本学の研究者を中心に研究をおこなってきた.過去3年間の研究成果として以下のようなものが考えられる. 1.日本語の数学の教科書および学術雑誌において.日本語領域と数式領域を切り分けるエンジンが開発できた. 2.英語の教科書および学術雑誌において,英語領域と数式領域を切り分けるエンジンの開発の目処ができた. 3.行列,条件式などを除けば,複雑な数式でも構造を正確に解析することができるエンジンを開発することができた. 数式の構造を解析するアルゴルズムは,解析を行う数式を総和記号,積分記号,根号記号など比較的大きな数学記号の前後の領域に分割し,これらの操作を再起的に行うトップダウン方式によった.数式構造を正確に解析する正解率は97%と高精度のエンジンを開発することができた. 本研究で開発された数式認識を用いて,印刷された数式文書を自動点訳するソフトの実用化の目処がたってきた. なお,今後の課題としては,行列や条件式および左側添え字などに対応できる数式認識エンジンの開発が望まれる.
|