本研究は、複数の人間が係わるプロジェクトで生成・収集される各種情報を共有し活用するための情報共有システムの構築法を考案することを目的としている。特に時間情報を考慮した、時系列文書の処理技術に焦点をあてて、情報共有システムを構築することをめざしている。これまでは主に単語集合として表されるテキストを対象とした情報共有法を検討してきたが、平成22~23年度は、テキストが構造を持っている場合の情報共有法について検討を行った。具体的には、XML等の木構造を持ったテキストを高精度にマッチングするための確率モデルを提案しその学習アルゴリズムを構築した。次に、統合されたテキストを効果的に利用者に提供するための情報推薦法について検討を行った。ここでは、まず、多言語で記述されたテキストを統一的に扱うために、異なった言語で記述されたテキストを同一の特徴空間に変換するための確率モデルを構築した。学術論文において著者が付与するキーワードを推薦する問題に適用して評価したところ、同一言語で記述されたアブストラクトからキーワードを推薦する場合と異なる言語で記述されたアブストラクトから推薦する場合でほぼ同程度の推薦精度を得ることができた。次に、より一般のアイテムに対する推薦問題について検討を行った。ここでは、特に利用者のアイテムに対する評価値について一定の重み付けを行う方法および評価値の低いアイテムの特性を活用する方法を考案し、各種の評価用データセットを用いて評価したところ、考案した手法によって推薦精度を向上させることができた。
|