研究課題/領域番号 |
17300052
|
研究機関 | 独立行政法人産業技術総合研究所 |
研究代表者 |
松尾 豊 独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (30358014)
|
研究分担者 |
和泉 潔 独立行政法人産業技術総合研究所, 企画本部, 研究員 (10356454)
橋田 浩一 独立行政法人産業技術総合研究所, 情報技術研究部門, 副研究部門長 (00357766)
|
キーワード | Webマイニング / 社会ネットワーク / 検索エンジン / キーワード抽出 |
研究概要 |
本研究では、Web上に存在する膨大な情報を用いて、研究者ネットワークを抽出し、研究者に関する情報を整備し、研究分野の研究活動を活性化させる情報支援を行うことを目的としている。本年度はその初年度であり、研究者ネットワークという観点から重要になるWebマイニング手法の研究を行った。 主に3つのテーマに対して研究を行った。ひとつは、研究者の研究に関するキーワードをWebから抽出する手法である。Web上で研究者名とよく共起する語を抽出するアルゴリズムを構築し、いくつかの方法を比較した評価を行って、誌上発表を行った。次に、研究者の研究内容による分類を行う手法を構築した。研究者名と語のWeb上での共起を手がかりに、類似の語の共起分布を持つ研究者をクラスタリングすることで、専門分野を同定する。まだ採録には至っていないが、論文にまとめている段階である。さらに、Webから研究者の情報を抽出する際に問題となる同姓同名の解決法について研究を進めた。特定の氏名が出現する各ページの内容を類似のものにまとめ、似たような文脈で出てくる名前をそれぞれ異なる人物だとし、その中の目的の人物に関するキーワードを抽出する。この理論的な背景と応用については、現在研究を進めている。 研究者の関係性は、Webマイニング以外にも複数の情報源から取得することができるが、それをどう融合するかは重要な課題である。そのためのオントロジの整備、社会ネットワーク的な観点から見た新しい手法の構築を進めており、国内の研究会等で発表を行った。以上の技術は、研究者の研究活動を促進する研究者検索システムPolyphonetとして、人工知能学会全国大会などの学会で試験的に運用された。その結果、システムや手法の改善についての知見、ユーザの振る舞いについての知見を得ることができ、今後の研究に生かすことができると考えている。
|