2016 Fiscal Year Research-status Report
翻刻・本文校訂を前提としないクラウド型古文書画像検索システムに関する研究
Project/Area Number |
15K00469
|
Research Institution | Yamaguchi University |
Principal Investigator |
中田 充 山口大学, 教育学部, 教授 (60304466)
|
Co-Investigator(Kenkyū-buntansha) |
葛 崎偉 山口大学, 教育学部, 教授 (30263750)
吉村 誠 山口大学, 教育学部, 教授 (70141116)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 特徴グラフ / 類似部分グラフ検索 / 同型部分グラフ / 類似画像検索 / 手書き古文書画像検索 |
Outline of Annual Research Achievements |
本年度は、「同型部分グラフ導出アルゴリズムの確立により、検索グラフと類似する構造を含む文書グラフの検索技術を実現する。」、「文字構造を表現する特徴グラフの生成手法の改良を行う。」、「古典籍影印本などをスキャンし、評価用古文書画像データを収集し整理する。」という3つ事項を中心に研究を進めてきた。
昨年度までに実装してきた、検索グラフと類似する構造を含む文書グラフを検索する手法を改良し、改善後の手法を評価するために、類似部分グラフ検索の評価実験を行った。この結果を、2016年7月に沖縄にて開催された査読付き国際会議ITC-CSCC2016にて「Implementation and Evaluation of Similar Subgraph Retrieving」というタイトルで発表した。発表後に、評価実験の結果を考察することで、必須グラフの複数の連結成分と同型の部分グラフの組合わせを求める処理の高速化が重要であることが明らかとなった。そこで、その高速化手法を提案・実装した上で評価実験を行った。この結果を、2017年3月に開催された電子情報通信学会システム数理と応用研究会において、「古文書画像検索システムのための類似部分グラフ検索手法の改良」というタイトルで発表した。 また、特徴グラフがより文字の構造を正確に表現できるように、特徴グラフの正規化の手順を提案し、特徴グラフ生成アルゴリズムの改良を行い、それを採用した特徴グラフ生成プログラムを実装している。現時点で、改良版の特徴グラフ生成プログラムが概ね完成しており、今後はそれを用いて、改良手法の有用性を検証する予定である。 さらに、昨年度までに作成した古文書画像を行単位に分割するプログラムを活用して、スキャンした古文書画像を行単位に分割した上で、改良した特徴グラフ生成プログラムを用いて、評価実験に用いる特徴グラフを作成した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の申請当初の計画では、本年度は、「(1)同型部分グラフ導出アルゴリズムの確立により、検索グラフと類似する構造を含む文書グラフの検索技術を実現する。」、「(2)古典籍影印本などをスキャンし、評価用古文書画像データを収集し整理する。」、「(3)高速検索アルゴリズムの確立により、文書グラフ索引技術を実現する。」という3つ事項を中心に研究を進める予定であった。 これに対して、本年度の研究実績の概要で述べたように、(1)については、検索技術の高速化を行い、その評価も実施した。評価の結果、今後も検索技術の高速化を行う必要があることが明らかとなっている。(2)については、現在、100行程度の評価用古文書画像データを収集し、その特徴グラフを作成している。(3)については、(2)の技術に基づき索引技術の提案を行っていく必要がある。以上のように、(3)については取り組めていないものの、(1)と(2)については堅調に進んでいると言える。
|
Strategy for Future Research Activity |
本研究申請時点では、H29年度は、「古典籍影印本などをスキャンし、評価用古文書画像データを収集し整理する。」、「高速検索アルゴリズムの確立により、文書グラフ索引技術を実現する。」、「インターネットを介して文書グラフと画像URLを作成・登録・検索するためのクラウド型古文書画像検索システム用Web APIを開発する。」という3つ事項を中心に研究を進める予定であったが、H28年度までの研究進捗状況を鑑み、H29年度は、「特徴グラフの正規化」、「類似部分グラフ検索の精度向上とさらなる高速化」、「そのための索引技術の設計」を進めることとする。
|
Causes of Carryover |
研究の進捗状況を考慮して,サーバー用パソコンの購入を次年度以降に見送ったため.
|
Expenditure Plan for Carryover Budget |
H29年度に類似部分グラフ検索プログラムの開発用兼サーバー用PCの購入費として使用する.
|
Research Products
(4 results)