2000 Fiscal Year Annual Research Report
Project/Area Number |
10874021
|
Research Institution | Fukuoka University of Education |
Principal Investigator |
玉利 文和 福岡教育大学, 教育学部, 教授 (70036937)
|
Co-Investigator(Kenkyū-buntansha) |
岩元 隆 福岡教育大学, 教育学部, 助教授 (30232713)
桑野 博 福岡教育大学, 教育学部, 助教授 (50036886)
上村 英樹 福岡教育大学, 教育学部, 教授 (00036906)
藤本 光史 福岡教育大学, 教育学部, 講師 (20270241)
白石 正人 福岡教育大学, 教育学部, 助教授 (70216183)
|
Keywords | OCR / 数式認識 / 数学記号 / 自動点訳 |
Research Abstract |
数式を認識するOCRはまだ実用化されていない.主な理由として, 1.数式は2次元的に配置され,構造を解析することが難しい. 2.数式は積分記号,総和記号,根号記号など比較的大きな文字から2重,3重の添字など小さな文字まである. 3.数式を多く扱う者が数学を専門にしているものに限り,OCRとして市場のニーズが余りない. 以上の理由により,企業も数式認識の大切さは,理解出来てもなかなか本格的な研究をおこなってくれない.そこで,我々は大学に籍を置き,数学を専門にしている者と情報に関心のある本学の研究者を中心に研究をおこなってきた.過去3年間の研究成果として以下のようなものが考えられる. 1.日本語の数学の教科書および学術雑誌において.日本語領域と数式領域を切り分けるエンジンが開発できた. 2.英語の教科書および学術雑誌において,英語領域と数式領域を切り分けるエンジンの開発の目処ができた. 3.行列,条件式などを除けば,複雑な数式でも構造を正確に解析することができるエンジンを開発することができた. 数式の構造を解析するアルゴルズムは,解析を行う数式を総和記号,積分記号,根号記号など比較的大きな数学記号の前後の領域に分割し,これらの操作を再起的に行うトップダウン方式によった.数式構造を正確に解析する正解率は97%と高精度のエンジンを開発することができた. 本研究で開発された数式認識を用いて,印刷された数式文書を自動点訳するソフトの実用化の目処がたってきた. なお,今後の課題としては,行列や条件式および左側添え字などに対応できる数式認識エンジンの開発が望まれる.
|
Research Products
(6 results)
-
[Publications] 白石正人: "WWWサーバにおける組織外アクセスとその最大コネクション数推定法"福岡教育大学紀要. 48. 103-114 (1999)
-
[Publications] 能隅進一: "絞り込み法による数式文字認識とその日本語/数式領域切りだしへの応用"電子情報通信学会論文誌. 83. 895-906 (2000)
-
[Publications] H,Okamura: "A Handwriting Interface for Computer Algebra Systems."Proceedings of the Fourth Asian Technology Conference on Mathematics, Guangzhou. 291-300 (1999)
-
[Publications] Ryoji,Fukuda: "A Technique of Mathematical Expression Structure Analysis for Handwriting Input System."Proceedings of the Fifth International Conference on Document Analysis and Recognition. 131-134 (1999)
-
[Publications] Hideki,Kamimura: "Clustering by a Fuzzy Metric"Fuzzy Sets and Systems. 120. 69-74 (2000)
-
[Publications] Hideki,Kamimura: "Clustering by a Fuzzy Metric : Application to the Cluster Median Problem"Bulletin of Information and Cybernetics. 32. 11-21 (2000)