2005 Fiscal Year Annual Research Report
江戸版本の読解を支援する運筆特徴を考慮したつづき文字の認識に関する研究
Project/Area Number |
17500165
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Toyohashi Sozo University |
Principal Investigator |
舟久保 登 豊橋創造大学, 経営情報学部, 教授 (70190121)
|
Co-Investigator(Kenkyū-buntansha) |
三好 哲也 豊橋創造大学, 経営情報学部, 教授 (10254434)
島田 大助 豊橋創造大学, 経営情報学部, 助教授 (50351177)
三輪 多恵子 豊橋創造大学, 経営情報学部, 講師 (60351178)
|
Keywords | 江戸版本 / 文字認識 / 運筆 |
Research Abstract |
本研究では、古典籍に含まれる文書に対する自動読み取りシステムの開発を目的としている。古典籍には、文字や画像が含まれ、文書によっては画像と文字が混合して構成されているため、図と文字の領域分割が必要である。また、文字は現代の活字体とは異なって「くずし字」からなっており、さらに時間の経過による原著の劣化や印刷技術の低さから古典関内の文字はかすれ、しみ、しわを有している。以上の前提を踏まえ、古典籍から文字情報を抽出するために、本年度は以下の調査研究を進めた。 1.本研究で対象とする古典籍の収集をおこない、含まれる文字のかすれ、しみ、しわなどの画像劣化の程度を把握するために古典籍(安永期の鳥居清経が関わった黄表紙仕立噺本)の収集を行った。収集した古典籍に対してデジタル画像化および画像の規格化を行った。 2.古典籍における文字認識は連続する文字に対する認識であるが、基礎的データとして分割された文字(約1100文字)に対する文字認識実験を行い約92%の認識率を得た。 3.文字に関する静的な情報のみならず、動的な情報として古典籍の文字のなぞりから運筆情報を収集し周波数特徴を抽出するシステムを開発した。仮名文字のくずしの程度を変化させたときの周波数特性の変化を量的に評価した。 4.古典籍に含まれる文章を1文字単位に分割し現代仮名との対比を容易に行える補助システムを開発し、文字単位での仮名文字データをデータベース化した。
|