まず、数百万規模の論文情報および数十万規模の特許情報の収集を行い、これらの大規模な学術・技術テキストデータの効率的な蓄積についてデータベースの設計を行った。次に、写像関数を用いた概念空間上で、文書間の類似尺度の設計を行った。設計した類似尺度を複数の領域に適用し妥当性を検証するとともに、論文群と特許群の関連性を可視化するツールを作成し、その成果を複数の学会において発表を行った。また、「学術俯瞰システム」を構築し、実証実験を行った。実証実験においては、抽出した概念語の妥当性、線形識別器野精度、文書間の関連度計算の精度、検索結果提示の妥当性について特に評価を行った。
|