研究課題/領域番号 |
22500875
|
研究機関 | 文部科学省科学技術政策研究所 |
研究代表者 |
古川 貴雄 文部科学省科学技術政策研究所, 科学技術動向研究センター, 上席研究官 (70262699)
|
研究分担者 |
白川 展之 文部科学省科学技術政策研究所, 科学技術動向研究センター, 上席研究官 (20556071)
佐々木 和也 宇都宮大学, 教育学部, 准教授 (60292570)
|
キーワード | ネットワーク分析 / 研究トレンド / WWW / データベース / コンピュータグラフィックス / バイオインフォマティクス |
研究概要 |
国際会議のセッション名の変遷から研究トレンドの変化を把握するために、国際会議の論文データセットを整備し、セッション間の関係を可視化するソフトウェアを開発した。まず、次に示す4つの国際会議で発表された論文の題目、著者、所属組織、アブストラクトとセッション名を含むデータを作成した。(1) World Wide Web (WWW) Conference 2002-2011 (2) Very Large Database 2002-2011 (3) SIGGRAPH 2002-2011 (4) Intelligent Systems for Molecular Biology 1998-2006 これらの国際会議を合わせて約1500件の論文を調査し、論文の題目、著者、所属組織、アブストラクトからなるデータを収集した。各国際会議が提供しているプログラムに基づき論文データを収集し、複数の論文データベースに登録されている論文情報を確認することで、正確なデータを作成した。次に、所属組織の名称について名寄せを行い、各論文のアブストラクトから抽出した単語について語形変化を取り除くステミング処理について検討した。 また、予備調査として、ロボティクス領域の論文タイトルを分析することにより、国別の研究領域の特徴を抽出する手法について検討を行った。 その他、組織の観点から研究トレンドを分析するための予備調査として、工学系研究領域における大学院生の国際的な移動についても分析を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
1. 平成22年度の課題の調査によって得られた研究分野の長期トレンドの詳細な解析 データの収集及び分析の過程において、十分な作業能力を有する研究協力者の確保に時間を要し、当初の計画で予定していたデータ量の収集まで到達しなかった。データ収集・分析の期間を延長したため、計画よりも遅れることになった。 2. 情報の可視化手法の改良 複数の国際会議のセッションから生成したネットワークの可視化手法等を新規に検討し、可視化ソフトウェアの機能を拡張をしたため、計画よりも遅れることになった。
|
今後の研究の推進方策 |
引き続き、研究分野の長期トレンドの詳細な解析と情報の可視化手法の改良を継続する。その他、以下の作業を進め、研究成果の外部発表を行う。 (1) 各論文のアブストラクトに記述されている単語の出現頻度、及び、tfidfなどのテキストマイニングで利用されている指標を計算し、各論文をベクトルデータとして記述する。 (2) 各論文に対応するベクトルデータから論文間の類似度を計算する。 (3) 論文間の類似度を用いて国際会議のセッション間の類似度を計算する。 (4) 国際会議のセッション間の類似度を用いて、ネットワークを生成し、セッション間の関係や時間的な推移を可視化する。 (5) 生成されたネットワークの妥当性を確認するために、接続されたセッションについて単語の出現頻度やtfidf等の検証を行う。
|