計画研究
本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成18年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。・多様な情報を扱うための統計モデルの研究本研究は、関係データベースのような構造化されたデータおよび文書のような半構造データを対象としている。本年度は、半構造データのリンケージの基本技術として木構造を持ったデータのマッチングアルゴリズムおよびマッチングのための類似度関数の学習問題に取り組み、効率の良い学習/マッチングアルゴリズムを考案した。また、木構造の各ノードに割当てられた文字列の類似度を計算するための効率的なアルゴリズムを開発した。・モノ検索およびリンケージモデルの研究本年度は、効果的な情報を抽出するための特徴量の抽出問題に取り組んだ。まず、一般的な文書に対する検索のために、文書の背景にあるトピックを抽出することを試み、ベイズ学習の枠組みで抽出したトピックに基づいた文書の分類法を提案した。また、文書中に記述されているさまざまな意見を考慮した検索を実現するための、言語モデルを構築し、このモデルに基づいた意見情報検索法を提案した。さらに、文書中に現れる人物の同定問題に取り組み、Web上に存在するディレクトリを利用して、特定人物に関する情報をWebから検索する方法を考案した。これらの要素技術に関する研究と並行して、大規模データベースを利用したエンティティの同定システムの構築を行い、学術文献や研究者を対象としたリンケージサーバを試作した。
すべて 2007 2006
すべて 雑誌論文 (6件)
SAC-IAR 2007
ページ: 185-191
ACM Transactions on Asian Language Information Processing 5・3
ページ: 264-289
情報処理学会論文誌データベース(TOD) 49・SIG19
ページ: 72-85
Proceedings of 17th International Symposium on Algorithms and Computation (ISAAC06)
ページ: 90-99
Proc. of 7th International Conference on Intelligent Data Engineeringand Automated Learning (IDEAL), Spain, Sep.20-23
ページ: 904-911
Proc. Asia Information Retrieval Symposium (AIRS) 2006
ページ: 625-632