2017 Fiscal Year Research-status Report
翻刻・本文校訂を前提としないクラウド型古文書画像検索システムに関する研究
Project/Area Number |
15K00469
|
Research Institution | Yamaguchi University |
Principal Investigator |
中田 充 山口大学, 教育学部, 教授 (60304466)
|
Co-Investigator(Kenkyū-buntansha) |
葛 崎偉 山口大学, 教育学部, 教授 (30263750)
吉村 誠 山口大学, 教育学部, 教授 (70141116)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 同形部分グラフ / 類似部分グラフ / 古文書画像検索 / 特徴グラフ |
Outline of Annual Research Achievements |
本年度は、「特徴グラフの正規化」、「類似部分グラフ検索の精度向上とさらなる高速化」、「そのための索引技術の設計」を進める予定で研究に取り組んできた。 昨年度までに実装してきた、検索グラフと類似する構造を含む文書グラフを検索する手法を改良し、「特徴グラフの正規化」を取り込んだ手法を提案した。その結果を、2017年7月に韓国釜山にて開催された査読付き国際会議ITC-CSCC2017にて「Improvement of Generation Method of Feature Graph Representing Japanese Handwritten Character String」というタイトルで発表した。 また、類似部分グラフ検索の精度向上とさらなる高速化を図る上で、より多くのデータを用いた評価実験が欠かせないが、評価実験用の検索条件を表す必須グラフを作成するアプリケーションを新たに開発した。さらに、昨年度までに作成した古文書画像を行単位に分割するプログラムを活用して、スキャンした古文書画像を行単位に分割してデータを充実する作業を行った。 次に、それらのデータを用いて、類似部分グラフ検索に基づいた類似部分画像を検索して切り出す評価実験を行った。実験の結果、グラフの構造が類似する部分は適切に切り出せるものの、異なる字であるにもかかわらず、たまたま、グラフの構造が似ている部分画像も切り出しているような結果も見られた。この問題点を解決するために、検索条件に含まれる必須グラフの構造を適切に指定する方法を検討する必要がある。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本年度は、「(1) 特徴グラフの正規化」、「(2)類似部分グラフ検索の精度向上とさらなる高速化」、「(3)そのための索引技術の設計」という3つ事項を中心に研究を進める予定であった。 これに対して、本年度の研究実績の概要で述べたように、(1)については、正規化を取り込んだ新たな特徴グラフ生成手法を実装した。(2)については、(1)の評価を実施し、その結果今後も検索技術の改良を行う必要があることが明らかとなっている。(3)については、(2)の技術に基づき索引技術の提案を行っていく必要がある。以上のように、(3)については取り組めておらず、やや遅れている状況である。
|
Strategy for Future Research Activity |
本研究申請時点では、本年度は、「インターネットを介して文書グラフと画像URLを作成・登録・検索するためのクラウド型古文書画像検索システム用Web APIを開発する。」、「収集したデータを用いて試作版検索システムを実装し評価する」という事項を中心に研究を進める予定であったが、前年度までの研究進捗状況を鑑み、本年度は、「特徴グラフの正規化及び生成を行うWeb APIの実装」、「類似部分グラフ検索の精度向上とさらなる高速化」、「そのための索引技術の設計」を進めることとする。
|
Causes of Carryover |
研究の進捗がやや遅れており、Web API開発に取り組むことが出来なかったため、Web API開発に必要なソフトウェア及び参考図書など購入の執行が無かったため。 H30年度にWeb API開発に取りかかる予定であるので、そこで使用する予定である。
|
Research Products
(2 results)