• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文書画像とウェブを活用した新しい電子図書館サービスに関する研究

研究課題

研究課題/領域番号 23700119
研究種目

若手研究(B)

配分区分基金
研究分野 メディア情報学・データベース
研究機関岡山大学

研究代表者

太田 学  岡山大学, 自然科学研究科, 教授 (10326019)

研究期間 (年度) 2011 – 2012
研究課題ステータス 完了 (2013年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2012年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2011年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
キーワード電子図書館 / 文書画像 / ウェブ / 情報抽出 / CRF / 電子書籍 / 閲覧支援 / 論文推薦 / メタデータ / 機関リポジトリ / 文書閲覧支援
研究概要

学術論文を蓄積する電子図書館では、論文中の書誌情報などを自動抽出する技術が求められる。本研究では、論文タイトルページの文書画像をOCRで解析して得られる各テキスト行や、参考文献文字列をトークン列に変換して得られる各トークンが、いずれの書誌要素に該当するか、条件付確率場(CRF)により推定して抽出する方法を提案した。また論文から抽出した専門用語を利用した関連論文推薦サービスを提案し、電子書籍閲覧端末による学術論文閲覧支援方法を検討した。

報告書

(4件)
  • 2013 実績報告書   研究成果報告書 ( PDF )
  • 2012 実施状況報告書
  • 2011 実施状況報告書
  • 研究成果

    (29件)

すべて 2014 2013 2012 2011 その他

すべて 雑誌論文 (10件) (うち査読あり 10件) 学会発表 (17件) 備考 (2件)

  • [雑誌論文] Rule management for information extraction from title pages of academic papers2014

    • 著者名/発表者名
      Atsuhiro Takasu and Manabu Ohta
    • 雑誌名

      Proc. of Third International Conference on Pattern Recognition Applications and Methods (ICPRAM 2014)

      巻: - ページ: 438-444

    • DOI

      10.5220/0004827204380444

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Empirical evaluation of CRF-based bibliography extraction from reference strings2014

    • 著者名/発表者名
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 11th IAPR International Workshop on Document Analysis Systems (DAS 2014)

      巻: - ページ: 287-292

    • 関連する報告書
      2013 実績報告書
    • 査読あり
  • [雑誌論文] Error detection of CRF-based bibliography extraction from reference strings2012

    • 著者名/発表者名
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 14th International Conference on Asia-Pacific Digital Libraries (ICADL 2012)

      巻: LNCS 7634 ページ: 229-238

    • DOI

      10.1007/978-3-642-34752-8_29

    • ISBN
      9783642347511, 9783642347528
    • 関連する報告書
      2013 研究成果報告書 2012 実施状況報告書
    • 査読あり
  • [雑誌論文] CRF による学術論文タイトルページからの書誌情報抽出における誤り検出2012

    • 著者名/発表者名
      太田学, 井上諒平, 高須淳宏
    • 雑誌名

      日本データベース学会論文誌

      巻: Vol.11, No.2 ページ: 37-42

    • NAID

      40019501165

    • URL

      http://dbsj.org/journal/dbsj_journal/dbsj_journal_vol_11_no_2_37_42/

    • 関連する報告書
      2013 研究成果報告書
    • 査読あり
  • [雑誌論文] A document analysis system for linking cross-document entities2012

    • 著者名/発表者名
      Manabu Ohta and Atsuhiro Takasu
    • 雑誌名

      Proc. of Fourth International Conference on Creative Content Technologies (CONTENT 2012)

      ページ: 14-20

    • URL

      http://www.thinkmind.org/index.php?view=article&articleid=content_2012_1_30_60066

    • 関連する報告書
      2013 研究成果報告書 2012 実施状況報告書
    • 査読あり
  • [雑誌論文] Empirical evaluation of CRF-based bibliography extraction from research papers2012

    • 著者名/発表者名
      Manabu Ohta, Ryohei Inoue, and Atsuhiro Takasu
    • 雑誌名

      Proc. of IADIS International Conference Information Systems 2012 (IS 2012)

      ページ: 18-26

    • URL

      http://www.is-conf.org/

    • 関連する報告書
      2013 研究成果報告書 2011 実施状況報告書
    • 査読あり
  • [雑誌論文] CRFによる学術論文タイトルページからの書誌情報抽出における誤り検出2012

    • 著者名/発表者名
      太田 学, 井上 諒平, 高須 淳宏
    • 雑誌名

      日本データベース学会論文誌

      巻: 11 ページ: 37-42

    • NAID

      40019501165

    • 関連する報告書
      2012 実施状況報告書
    • 査読あり
  • [雑誌論文] Empirical evaluation of CRF-based bibliography extraction from research papers2012

    • 著者名/発表者名
      Manabu Ohta, Ryohei Inoue, and Atsuhiro Takasu
    • 雑誌名

      IADIS International Journal on Computer Science and Information Systems

      巻: 7 ページ: 18-31

    • 関連する報告書
      2012 実施状況報告書
    • 査読あり
  • [雑誌論文] CRF-based bibliography extraction from reference strings focusing on various token granularities2012

    • 著者名/発表者名
      Manabu Ohta, Daiki Arauchi, Atsuhiro Takasu, and Jun Adachi
    • 雑誌名

      Proc. of 10th IAPR International Workshop on Document Analysis Systems (DAS 2012)

      巻: - ページ: 276-281

    • 関連する報告書
      2011 実施状況報告書
    • 査読あり
  • [雑誌論文] Related paper recommendation to support online-browsing of research papers2011

    • 著者名/発表者名
      Manabu Ohta, Toshihiro Hachiki, and Atsuhiro Takasu
    • 雑誌名

      Proc. of Fourth International Conference on the Applications of Digital Information and Web Technologies (ICADIWT 2011)

      ページ: 130-136

    • DOI

      10.1109/icadiwt.2011.6041413

    • 関連する報告書
      2013 研究成果報告書 2011 実施状況報告書
    • 査読あり
  • [学会発表] CRF による参考文献書誌情報抽出のための学習コストの削減2014

    • 著者名/発表者名
      川上尚慶, 太田学, 高須淳宏, 安達淳
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      兵庫
    • 年月日
      2014-03-04
    • 関連する報告書
      2013 研究成果報告書
  • [学会発表] 学術論文からの構成要素抽出の一手法2014

    • 著者名/発表者名
      樫本達矢, 太田学, 高須淳宏
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      兵庫
    • 年月日
      2014-03-04
    • 関連する報告書
      2013 研究成果報告書
  • [学会発表] 学術論文閲覧支援インタフェースの試作2014

    • 著者名/発表者名
      前野明子, 太田学, 高須淳宏
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      兵庫
    • 年月日
      2014-03-03
    • 関連する報告書
      2013 研究成果報告書
  • [学会発表] 学術論文閲覧支援インタフェースの試作2014

    • 著者名/発表者名
      前野 明子, 太田 学, 高須 淳宏
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] 学術論文からの構成要素抽出の一手法2014

    • 著者名/発表者名
      樫本 達矢, 太田 学, 高須 淳宏
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] CRFによる学術論文からの参考文献文字列の抽出2014

    • 著者名/発表者名
      石本 茜, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] CRFによる参考文献書誌情報抽出のための学習コストの削減2014

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第6回データ工学と情報マネジメントに関するフォーラム (DEIM2014)
    • 発表場所
      淡路夢舞台&ウェスティン淡路(兵庫)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] CRFによる学術論文からの実験情報抽出の一手法2014

    • 著者名/発表者名
      平井 久貴, 新妻 弘崇, 太田 学
    • 学会等名
      電子情報通信学会2014年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • 発表場所
      新潟大学(新潟)
    • 関連する報告書
      2013 実績報告書
  • [学会発表] 文献種類別に分類した参考文献文字列からの書誌情報抽出の一手法2013

    • 著者名/発表者名
      川上 尚慶, 荒内 大貴, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第5回データ工学と情報マネジメントに関するフォーラム(DEIM 2013)
    • 発表場所
      ホテル華の湯(福島)
    • 関連する報告書
      2012 実施状況報告書
  • [学会発表] データ工学に関する学術論文からの実験情報抽出の試み2013

    • 著者名/発表者名
      樫本 達矢, 荒内 大貴, 太田 学
    • 学会等名
      電子情報通信学会2013年総合大会, 情報・システムソサイエ ティ特別企画学生ポスターセッション
    • 発表場所
      岐阜大学(岐阜)
    • 関連する報告書
      2012 実施状況報告書
  • [学会発表] CRFによる和英文の参考文献文字列からの自動書誌要素抽出2012

    • 著者名/発表者名
      荒内 大貴, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      情報処理学会第156回データベースシステム研究発表会
    • 発表場所
      キャンパスプラザ京都 (京都)
    • 関連する報告書
      2012 実施状況報告書
  • [学会発表] 学術論文からの自動書誌要素抽出の頑健性評価2012

    • 著者名/発表者名
      土居 幸平, 太田 学
    • 学会等名
      電子情報通信学会2012年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • 発表場所
      岡山大学(岡山県)
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] 協調フィルタリングによる学術論文推薦に関する一検討2012

    • 著者名/発表者名
      丸一 博司, 太田 学
    • 学会等名
      電子情報通信学会2012年総合大会, 情報・システムソサイエティ特別企画学生ポスターセッション
    • 発表場所
      岡山大学(岡山県)
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] CRF による論文文書画像の書誌要素推定における自動誤り検出2011

    • 著者名/発表者名
      井上諒平, 太田学, 高須淳宏
    • 学会等名
      第4回Web とデータベースに関するフォーラム (WebDB Forum) 2011
    • 発表場所
      東京
    • 年月日
      2011-11-05
    • 関連する報告書
      2013 研究成果報告書
  • [学会発表] CRF による参考文献文字列からの書誌要素抽出の一手法2011

    • 著者名/発表者名
      荒内大貴, 太田学, 高須淳宏, 安達淳
    • 学会等名
      第4回Web とデータベースに関するフォーラム (WebDB Forum) 2011
    • 発表場所
      東京
    • 年月日
      2011-11-05
    • 関連する報告書
      2013 研究成果報告書
  • [学会発表] CRFによる参考文献文字列からの書誌要素抽出の一手法2011

    • 著者名/発表者名
      荒内 大貴, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第4回Webとデータベースに関するフォーラム (WebDB Forum) 2011
    • 発表場所
      工学院大学(東京都)
    • 関連する報告書
      2011 実施状況報告書
  • [学会発表] CRFによる論文文書画像の書誌要素推定における自動誤り検出2011

    • 著者名/発表者名
      井上 諒平, 太田 学, 高須 淳宏
    • 学会等名
      第4回Webとデータベースに関するフォーラム (WebDB Forum) 2011
    • 発表場所
      工学院大学(東京都)
    • 関連する報告書
      2011 実施状況報告書
  • [備考] ① Outstanding Paper Award at IADIS International Conference Information Systems 2012 (IS 2012), Empirical evaluation of CRF-based bibliography extraction from research papers, Manabu Ohta, Ryohei Inoue, and Atsuhiro Takasu, 2012.3.12. 受賞

    • 関連する報告書
      2013 研究成果報告書
  • [備考] ② Best Paper Award at Fourth International Conference on Creative Content Technologies (CONTENT 2012), A document analysis system for linking cross-document entities, Manabu Ohta and Atsuhiro Takasu, 2012.7.27. 受賞

    • 関連する報告書
      2013 研究成果報告書

URL: 

公開日: 2011-08-05   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi