研究課題/領域番号 |
12640133
|
研究機関 | 大分大学 |
研究代表者 |
福田 亮治 大分大学, 工学部, 助教授 (70238492)
|
研究分担者 |
小畑 経史 大分大学, 工学部, 助手 (00244153)
原 恭彦 大分大学, 工学部, 講師 (90208653)
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
キーワード | 数式認識 / 図形認識 / 太字判定 / フォント認識 |
研究概要 |
われわれが解析の対象とする画像は、数式を含む文書画像であるが、そこにはさまざまな意味で不確定的な要素がある。今年度はその中から、線図形としての統計的性質と、線の太さや形状に関する統計的性質、それから文字矩形の配置に関する統計的な性質に関する研究を中心として研究を行った。 線図形は、文字を構成するというだけではなくて、教科書などには不可欠な関数のグラフの要素ともなりうるものである。これらの線図形の中で、基本的な直線、円弧、放物線の各パラメータの推定と相互の交わり接触の情報の取得に関して、画像の縦横の連続する黒画素の集まりであるランを基本単位とした尤度を元に各種パラメータを推定し、その後に各図形相互の交点と接点の座標の取得を行った。 文字の形状(フォント情報は)特に数式の中では特定の意味を持つことがあり、この認識なしでは正確に文書を把握することができない重要な問題であるが、特に事前情報や画像情報が少ない場合はその判断が難しいことが多い。特に太字でかかれた文字はその数式上での意味が明確に異なるにも関わらず、太さという相対的な情報であるがゆえに局所的にはその判断がつきかねることになる。このような事態を解決する糸口として、アルファベット大文字の部分パターンのうちのいくつかを抜き出しそのパターンごとにその形状を比較することで、そのパターンが通常のものか太い文字のものかを判断する手法を提案した。 最後に、数式における各種文字の配置に関しては、その相互位置関係が数式の意味を決定することになる。その場合相互の大きさの関係も併せて問題になるが、特殊記号類など大きさの特定の難しい文字があるととたんに解析が難しくなる。この問題を解決するために、数式全体からなるネットワークを最適化するという形で数式の解析を行う手法を提案した
|