2016 年度実績報告書

実験用マテリアル・リソースの引用にもとづく新しい研究機関影響度指標の開発

研究課題

研究課題/領域番号	26540170
研究機関	国立研究開発法人物質・材料研究機構
研究代表者	天野晃国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門材料データプラットフォームセンター, NIMSエンジニア (20622012)
研究分担者	角田裕之鶴見大学, 文学部, 教授 (30454961)
研究期間 (年度)	2014-04-01 – 2017-03-31
キーワード	バイオリソース / 研究機関影響度
研究実績の概要	[27年度内容を継続] 基礎データ(バイオリソース名、機関名)および「正解センテンス集合」(材料供与の記述が明確なセンテンス)の抽出はすでに報告の通り完了している。28年度は「正解センテンス集合」より抽出したパターンをもとに、二つの方法でバイオリソース名候補を拡張を行っている。バイオリソース名拡張の方法１(完了)：後の4パターンに場合分けしそれぞれにおいて<リソース名>と<機関名>の中間に存在するフレーズを集計した。文章全体における出現頻度と、「正解センテンス集合」における出現頻度を比較し、検索用フレーズを構築した。この検索用フレーズを全文書の[謝辞セクション]および[材料セクション]において検索を完了した。バイオリソース名候補となるターム集合に対して、辞書を用いてセレクションを行った。パターン:(1)<機関名>...<バイオリソース名>/[材料セクション]、パターン(2):<機関名>...<バイオリソース名>/[謝辞セクション]、パターン(3):<バイオリソース名>...<機関名>/[材料セクション]、パターン(4):<バイオリソース名>...<機関名>/[材料セクション]。バイオリソース名拡張の方法２(未完)：もう一つの拡張方法として、時間を考慮しないマルコフ連鎖を仮定した検索法を構築中。文章全体のバイグラム出現頻度と「正解センテンス集合」におけるそれとの比較を考慮する。タームに対してイン一種の「確からしさ」のデックスを与える。 [バイオリソース引用指標] 具体的な引用指標はまだ計算していない。機関名として述べ1022機関(ユニーク36機関)、リソース名として(第一回検索)述べ1369リソース(ユニーク445リソース)が抽出された。

研究成果
(4件)

すべて 2016 その他

すべて雑誌論文 (1件) (うち謝辞記載あり 1件) 学会発表 (1件) 備考 (2件)

[雑誌論文] 実験用生物資源情報に基づく提供機関評価の試み2016
- 著者名/発表者名
  天野晃, 角田裕之, 石川大介
- 雑誌名
  
  NISTEP NOTE
  
  巻: 19 ページ: 79-89
- 謝辞記載あり
[学会発表] 論文マイニングのための生物系実験材料名辞書及び提供機関名辞書の作成2016
- 著者名/発表者名
  天野晃, 石川大介, 角田裕之, 柴田大輔, 水野澄子
- 学会等名
  情報メディア学会第18回研究会発表資料
- 発表場所
  東邦大学大森キャンパス
- 年月日
  2016-11-26
[備考] KAKEN-26540170
- URL
  https://github.com/kouamano/KAKEN-26540170
[備考] /~kamano/data/BANK/PMC/20140724/
- URL
  http://n007.nims.go.jp/~kamano/data/BANK/PMC/20140724/