研究課題/領域番号 |
19500214
|
研究機関 | 山口大学 |
研究代表者 |
中田 充 山口大学, 教育学部, 准教授 (60304466)
|
研究分担者 |
葛 崎偉 山口大学, 教育学部, 教授 (30263750)
吉村 誠 山口大学, 教育学部, 教授 (70141116)
|
キーワード | 特徴グラフ / 手書き文字認識 / クラスタリング / 曲頂点追加 |
研究概要 |
本研究では、変体仮名の使用頻度情報を用いて古文献の時代定位を行う。そのためには、変体仮名を含む古文献上の続け字を文字認識する技術が必要となる。本研究では、文字認識の基礎情報として、"文字の形に関する情報"(文字構造情報)を用いる、そのためには、文字構造情報を表現したモデルが必要となるが、一般的に古文献中の文字は、つづけ字や崩し字などで書かれているため、そのモデルは、つづけ字や崩し字の構造も表現したものでなければならない。そこで、崩し字・つづけ字で書かれた一連の文字の構造を、グラフ理論を用いて表現するモデル化手法を以下のような手順で提案した。 A)文字の一部分のグラフ化:手書きの文字を構成する、直線・曲線等の筆使いの情報を抽出し、その情報に基づいて文字の一部分をグラフ化した。 B)一つの文字のグラフ化:A)のグラフを用いて、変体仮名辞典や代表的な古文献影印本に書かれている文字の一文字ずつの構造をグラフ化した。 C)つづけ字のグラフ化:代表的な古文献影印本を調査し、一行を連続したつづけ字としてとらえてグラフ化した。 また、スキャナで取り込んだ古文献の一文字の画像から、その文字の形状を表現するグラフ(特徴グラフと呼ぶ)を自動生成するアプリケーションプログラムを作成し、A)〜C)の手順を実際の文字画像に適用して、その有用性を確認した、プログラムの作成過程では、グラフ化の前処理として、細線化・クラスタリング、曲頂点追加等のアルゴリズムを提案・実装した。
|