今年度の研究を通して得た成果は以下の通りである。 1.印刷文書の再使用に関する成果 印刷文書の背景(白地)に細かい点を配置することにより、データを記録する方式を考案した。本手法は、位置ずれによって1ビットの情報を表す点をマトリックス状に配置するものである。特徴は、データの記録に用いる点が非常に細かく(0.04×0.08mm)人間には薄い灰色にしか知覚できない点にある。技術論文紙面を対象とした実験の結果、20%の読み取り誤りを許容しても、ページあたり4KBのデータを埋め込むことに成功した。 2.文書画像検索の高度化 文書画像検索の新しい手法として、2次元パッセージ検索に基づく手法を考案した。この手法は、「検索質問に含まれる単語が密集して存在する部分は検索質問に関連する可能性が高い」という考えに基づく手法である。また、検索精度を向上させるため、擬似関連フィードバックと呼ばれる手法を導入した。英文論文画像を対象とした実験の結果、従来の代表的な電子テキスト検索法に比べて精度の向上が見られた。 3.電子文書の情報素材への分解 電子文書生成への第一歩として、プロフィール情報を対象とした情報抽出法を考案した。提案手法の特徴は、従来のように個別属性値の抽出だけではなく、得られた属性値を個人のプロフィール情報へと統合する点にある。これにより、文書の様々な箇所で断片的に書かれている情報がまとめられ、より充実した情報を抽出できる。新聞データ1ヶ月分を対象とした実験の結果、改良の余地はあるものの有効性を示すことができた。
|