研究課題/領域番号 |
12640133
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
数学一般(含確率論・統計数学)
|
研究機関 | 大分大学 |
研究代表者 |
福田 亮治 大分大学, 工学部, 助教授 (70238492)
|
研究分担者 |
小畑 経史 大分大学, 工学部, 助手 (00244153)
原 恭彦 大分大学, 工学部, 講師 (90208653)
鈴木 昌和 九州大学, 大学院・数理学研究院, 教授 (20112302)
|
研究期間 (年度) |
2000 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
2002年度: 1,100千円 (直接経費: 1,100千円)
2001年度: 1,100千円 (直接経費: 1,100千円)
2000年度: 1,400千円 (直接経費: 1,400千円)
|
キーワード | 文字認識 / 図形認識 / 確率的モデル化 / データ予測 / 数式認識 / 太字判定 / フォント認識 / OCR / 投票 |
研究概要 |
文字認識をはじめとする比較的単純な2値画像の認識には、しばしば統計的な特徴を用いた手法が用いられる。これらの技術の中には、経験的に取り入れられるものも数多くあり、その全体像を把握するのは困難であるが、およそ1.図形としての分布(通常何らかの特徴量を通して、多次元の分布となる)、2.文書内の文字記号としての分布、3.システムの動きに関する分布に大別して考えることが出来る。これらの視点に立って、対応する基本技術である統計的処理における分布を解析し、より実情にあった処理を考えることで、システムの性能の改善を図るとともに、そこに潜む本質的かつ汎用的な問題の発見と解決を目指すことを目標とした。 その結果、複数の認識手法における結果を順位を元にした統計的な評価を元に融合する方法を開発するとともに、文字認識における線種の識別および、線図形としてのグラフの認識に関して、線図形の分布の解析を前提とした手法を開発することが出来た。 さらに、線図形の中に潜むノイズの解析を数値データのグラフに適用することにより、コンクリートの乾燥収縮のデータ予測および、欠損データの復元にこれを応用することが出来た。 また、これらの手法を前提としたシステムとして、スキャナーで読み取った数式を含む文書を認識し、その認識結果を表示編集するシステムのいくつかの処理の中に、統計的な手法を織り込むことで、その性能を高めることが出来た。さらに、投票を用いた融合手法に関しては、理論的な立場からも更なる解析を進め、意思決定の分野への応用も実現することが出来た。これらの技術、すなわち、データ予測やそれに伴うノイズ除去、集団の意思決定への適応などは、現時点では文字認識と融合されていないものもあるが、そこに内在する理論は十分汎用性を持つものであり、相互に発展することが期待される。
|