研究課題/領域番号 |
17500165
|
研究機関 | 豊橋創造大学 |
研究代表者 |
舟久保 登 豊橋創造大学, 情報ビジネス学部, 教授 (70190121)
|
研究分担者 |
三好 哲也 豊橋創造大学, 情報ビジネス学部, 教授 (10254434)
島田 大助 豊橋創造大学, 情報ビジネス学部, 准教授 (50351177)
三輪 多恵子 豊橋創造大学, 情報ビジネス学部, 准教授 (60351178)
|
キーワード | 江戸版本 / 文字認識 / 運筆 |
研究概要 |
古典籍に含まれる文字は、現代の活字体とは豊なって「くずし字」からなっており、さらに時間の経過による原著の劣化(汚れ・虫損)や印刷技術の低さから古典籍に含まれる文字はかすれ、しみ、しわを有している。古典籍に含まれる文字認識の精度向上には文字画像パターンを要素とする判別だけでなく、平仮名と漢字の構成比率や文字種の出現確率などの統計情報の活用が考えられる。また、古典籍に含まれる文字は、現在のような活版印刷ではなく、同一文字でも種々の崩し方やその程度によって多くの字形が存在する。そのため「崩し」に対する頑健性が求められる。以上の前提を踏まえ、本研究では、古典籍における文字認識システム構築のための基礎的研究として、分析対象のデータベース化を行い、それに基づく文章を構成する文字についての統計分析、運筆に着目した文字認識、パターンマッチング手法を平成18年度までに行ってきた。平成19年度では、これらをさらに推し進め、古典籍を特徴づける要因についての分析を行った。本年度は以下の調査研究を進めた。1.鳥居清経が関わる安永期の黄表紙仕立噺本の文字情報について報告を行い、現在継続中の文字認識システム構築のための基本データ収集を行った。発刊年別の十種の古典籍を分析した結果、漢字が平仮名に、複数の字母を持つ仮名が特定の平仮名に置き換えられる傾向を確認した。2.仮名文字の運筆は字母となる漢字の筆順に依存しており、これを波形として扱うことで、崩し方の程度による文字形状の変化、および、文字間のつづきによる影響を軽減した文字認識システムが構築できる。そのためにまず、仮名文字のくずしの程度を変化させたときの周波数特性の変化を量的に評価した。そして、古典籍に含まれる仮名つづき文字に対して、手作業により運筆情報の抽出を行い、テンプレートとの絶対値差分和による文字認識の可能性を確認した。
|