2011 Fiscal Year Annual Research Report
利用者本位の古文書デジタルアーカイブを実現する情報検索技術
Project/Area Number |
22720239
|
Research Institution | J. F. Oberlin University |
Principal Investigator |
耒代 誠仁 桜美林大学, 総合科学系, 講師 (00401456)
|
Keywords | 情報検索 / 古代木簡 / デジタルアーカイブ / 画像処理 / パターン認識 |
Research Abstract |
本研究では、古代木簡デジタルアーカイブをターゲットとした知的情報検索の実現に向けて、ユーザ(専門家)への思考面での負担を軽減しつつ有用な情報を提示する情報検索理論・技術の構築を目標としてきた。23年度については、情報検索精度の向上、検索対象の拡大、画像処理の改善、および使い勝手(ユーザインタフェース)の改善を行った。 検索精度の向上については、破損を伴う字形の評価基準として墨濃度の勾配特徴を導入し、字形輪郭部の荒れ、にじみなどに頑健な類似度計算技術を実現した。勾配特徴は字形筆記時の運筆方向の推定に確率的なソフトディシジョンの導入を可能にする。ここで必要となる確率モデルの構築では、実際に古代木簡から得られた字形情報(後述)を活用した。また、評価結果として得られる類似度(確率値)に経験知に基づく後処理を加えることで文脈処理とのスムーズな連携に考慮した。 検索対象の拡大では、古代木簡データベース『木簡字典』の拡張によって得られた多数の古代木簡画像から新たな字形情報を抽出・整理することで実現した。この成果は検索対象となる古代木簡の拡大だけでなく字形評価技術の精度向上にも大きく貢献した(前述)。 画像処理の改善では、古代木簡の画像に対する分析結果を基に字形(墨)を木簡表面の木目、腐食、荒れなどと効果的に分離可能な処理技術を実現した。この画像処理技術では調整の必要なパラメータを最小限に留めたことが特徴である。これに伴い、今までは複雑なパラメータ調整が必要となっていた画像処理用インタフェースを全面的に置き換え、シンプルな作業で字形(墨)を抽出できるようにした。
|
Research Products
(5 results)