研究課題/領域番号 |
24700137
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
森 純一郎 東京大学, 工学(系)研究科(研究院), 講師 (30508924)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2013年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2012年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 計量書誌分析 / 構造的関連性学習 / 機械学習 / 情報検索 / 学術情報 / テキストマイニング |
研究成果の概要 |
まず、数百万規模の論文情報および数十万規模の特許情報の収集を行い、これらの大規模な学術・技術テキストデータの効率的な蓄積についてデータベースの設計を行った。次に、写像関数を用いた概念空間上で、文書間の類似尺度の設計を行った。設計した類似尺度を複数の領域に適用し妥当性を検証するとともに、論文群と特許群の関連性を可視化するツールを作成し、その成果を複数の学会において発表を行った。また、「学術俯瞰システム」を構築し、実証実験を行った。実証実験においては、抽出した概念語の妥当性、線形識別器野精度、文書間の関連度計算の精度、検索結果提示の妥当性について特に評価を行った。
|