• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

機械学習による統合的書誌メタ情報編集システムの実装

研究課題

研究課題/領域番号 24300097
研究機関国立情報学研究所

研究代表者

安達 淳  国立情報学研究所, コンテンツ科学研究系, 教授 (80143551)

研究分担者 太田 学  岡山大学, 自然科学研究科, 教授 (10326019)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード書誌パージング / メタデータ / コーパス / CRF / 機関リポジトリ / テキストマイニング
研究実績の概要

本研究は、統合的なメタ情報編集の環境として、電子文書の中からメタ情報を抽出し、その編集とともに他のデータベースと付き合わせて同定を精度良く行うためのシステムの実装を目指している。特に学術論文のような電子文書からメタ情報として書誌および引用文献情報を抽出し、書誌要素への分解などを行う。
平成26年度は、これまでに整備した電子情報通信学会論文誌の和文誌、英文誌と情報処理学会論文誌(和文誌)の論文の合計1万3千件以上の参考文献文字列コーパスを利用して、CRFの学習コストを抑えながら高精度に書誌情報を抽出する方法を提案し、実験により評価した。この研究成果については国際会議や国内フォーラムで発表するとともに、雑誌論文にまとめた。実用的な成果物としては、学術論文のレイアウト解析、引用文献文字列のパージング、サポートベクトルマシン(SVM)による文献レコード同定などのモジュールを有機的に結合し、文字列編集のソフトウェアとも連携して動作する統合的メタ情報編集環境システム(MWB)を、外注なども利用して開発した。またMWBのデモシステムも実装し、情報処理学会など一部学会の電子図書館のもつ実データのメタ情報の編集を試みた。さらに、論文から抽出する情報を書誌情報以外にも広げ、論文からの専門用語や実験に関わる図表などの自動抽出と、抽出した情報を利用した論文閲覧支援の研究にも取り組んだ。これらの研究成果については国内フォーラムなどで発表した。

現在までの達成度 (段落)

26年度が最終年度であるため、記入しない。

今後の研究の推進方策

26年度が最終年度であるため、記入しない。

次年度使用額が生じた理由

26年度が最終年度であるため、記入しない。

次年度使用額の使用計画

26年度が最終年度であるため、記入しない。

備考

受賞
第7回Webとデータベースに関するフォーラム (WebDB Forum 2014) 学生奨励賞, 少量学習データによる参考文献書誌情報抽出, 川上 尚慶, 2014年11月20日.

  • 研究成果

    (8件)

すべて 2015 2014

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件)

  • [雑誌論文] 少量学習データによる参考文献書誌情報抽出精度の向上2015

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 雑誌名

      情報処理学会論文誌:データベース

      巻: 8 ページ: -

    • 査読あり
  • [雑誌論文] Cost Evaluation of CRF-Based Bibliography Extraction from Reference Strings2014

    • 著者名/発表者名
      Naomichi Kawakami, Manabu Ohta, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 16th International Conference on Asia-Pacific Digital Libraries (ICADL 2014)

      巻: LNCS 8839 ページ: 268-278

    • DOI

      10.1007/978-3-319-12823-8_28

    • 査読あり
  • [学会発表] 学術論文からの実験情報抽出の一手法2015

    • 著者名/発表者名
      平井 久貴, 新妻 弘崇, 太田 学, 高須 淳宏
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
  • [学会発表] 引用意図を利用した学術論文閲覧支援のための適切な被引用箇所の特定2015

    • 著者名/発表者名
      石井 仁子, 太田 学, 高須 淳宏
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
  • [学会発表] 学術論文からの構成要素抽出手法の改良2015

    • 著者名/発表者名
      樫本 達矢, 太田 学, 高須 淳宏
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
  • [学会発表] CRFによる様々な種類の学術論文からの参考文献文字列の自動抽出2015

    • 著者名/発表者名
      赤澤 琢朗, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第7回データ工学と情報マネジメントに関するフォーラム (DEIM2015)
    • 発表場所
      磐梯熱海ホテル華の湯(福島県郡山市)
    • 年月日
      2015-03-02 – 2015-03-04
  • [学会発表] 少量学習データによる参考文献書誌情報抽出2014

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第7回Webとデータベースに関するフォーラム (WebDB Forum 2014)
    • 発表場所
      芝浦工業大学(東京都江東区)
    • 年月日
      2014-11-19 – 2014-11-20
  • [学会発表] 学術論文閲覧支援インタフェースのための頭字語の活用2014

    • 著者名/発表者名
      前野 明子, 太田 学, 高須 淳宏
    • 学会等名
      第160回DBS・第131回OS・第35回EMB合同研究発表会
    • 発表場所
      芝浦工業大学(東京都江東区)
    • 年月日
      2014-11-18

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi