• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

実験情報の抽出・可視化・推薦のための電子図書館システムの研究

研究課題

研究課題/領域番号 15H02789
研究機関国立情報学研究所

研究代表者

高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)

研究分担者 正田 備也  長崎大学, 工学研究科, 准教授 (60413928)
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード電子図書館 / トピックモデル
研究実績の概要

学術情報からの情報抽出については、CRFを用いた書誌情報の抽出法を考案した。CRFの学習には通常一定量のラベル付きデータが必要になる。学習データは人手で作成する必要があり、作成コストの低減が求められる。本研究では、能動学習および転移学習法について検討を行い、サンプリング戦略の提案と評価実験を行った。その結果、サンプリング戦略を工夫することで必要となる学習データを減らすことができることを示した。
学術情報の分析に関しては、トピックモデルの効率的な推定アルゴリズムについて検討を行った。LDAにおける隠れ変数について、通常は一様分布を用いて初期化するところを、同じ文書内の他の隠れ変数の値に依存したヒューリスティックな手法によって初期化する手法を提案した。また、各文書でのトピック確率分布を、タイムスタンプや緯度経度などの時空情報に依存させた場合でも、変分ベイズのように最適化による推定をおこなうのではなく、サンプリングによって近似の少ない推定を実現できることを示した。
使われているサンプリング手法は、ロジスティック正規分布によって定義された離散的な確率分布ならどのような分布でも適用可能であり、今回は時空情報に依存したトピック確率の推定という具体的な応用に適用した。この研究を実施することにより、変分ベイズのような近似の入る推定に訴えなくても、スライスサンプリングさえ駆使すれば、様々なメタデータをトピックモデルにおいて利用できることが分かった。
学術情報の推薦については、推薦精度の向上をはかるため、コンテキスト依存推薦法を考案した。多様なコンテキストを組み合わせることによって精度の向上を図れるが、一方で計算コストが大きくなる。本研究では、粒子群最適化技術を用いることでコンテキストの効率的な選択を実現した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

全体的にほぼ計画通りに進んでいるが、実体抽出法の研究では、当初予定より多くのデータ収集が必要になることがわかったため、繰越を申請し、H28年度に学術情報の収集と評価を行なった。

今後の研究の推進方策

学術情報抽出については、引き続き、必要となる学習データの低減法に取り組む。また、本年は、書誌情報抽を行ったが、今後、他のタイプの情報抽出問題にも取り組む。
学術情報からのトピック抽出については、本年度に引き続き学習アルゴリズムの高速化に取り組み、大規模な学術情報の分析を可能とする。
情報推薦については、学術情報中に現れる様々なエンティティに関する情報推薦法に向けて、研究を展開する。

  • 研究成果

    (8件)

すべて 2015 その他

すべて 国際共同研究 (1件) 雑誌論文 (5件) (うち国際共著 2件、 査読あり 5件) 学会発表 (2件) (うち招待講演 1件)

  • [国際共同研究] チュラロンコン大学(タイ)

    • 国名
      タイ
    • 外国機関名
      チュラロンコン大学
  • [雑誌論文] Similar Subtree Search Using Extended Tree Inclusion2015

    • 著者名/発表者名
      Tomoya Mori, Atsuhiro Takasu, Jesper Jansson, Jaewook Hwang, Takeyuki Tamura, Tatsuya Akutsu
    • 雑誌名

      IEEE Transactions on Knowledge and Data Engineering

      巻: 27 ページ: 3360 - 3373

    • DOI

      10.1109/TKDE.2015.2457922

    • 査読あり / 国際共著
  • [雑誌論文] Bayesian Probabilistic Model for Context-Aware Recommendations2015

    • 著者名/発表者名
      Padipat Sitkrongwong, Saranya Maneeroj, Pannawit Samatthiyadikun, Atsuhiro Takasu
    • 雑誌名

      International Conference on Information Integration and Web-based Applications & Services

      巻: (iiWAS 2015) ページ: 166 - 175

    • DOI

      10.1145/2837185.2837223

    • 査読あり / 国際共著
  • [雑誌論文] Heuristic Pretraining for Topic Models2015

    • 著者名/発表者名
      Tomonari Masada, Atsuhiro Takasu
    • 雑誌名

      Proc. of IEA/AIE 2015, Springer Lecture Notes in Computer Science

      巻: 9101 ページ: 123 - 134

    • DOI

      10.1007/978-3-319-19066-2_34

    • 査読あり
  • [雑誌論文] Utilization of Multiple Sequence Analyzers for Bibliographic Information Extraction2015

    • 著者名/発表者名
      Atsuhiro Takasu, Manabu Ohta
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 9443 ページ: 222 - 236

    • DOI

      10.1007/978-3-319-25530-9_15

    • 査読あり
  • [雑誌論文] 少量学習データによる参考文献書誌情報抽出精度の向上2015

    • 著者名/発表者名
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • 雑誌名

      情報処理学会論文誌 データベース

      巻: 8 ページ: 18 - 29

    • 査読あり
  • [学会発表] CRFによる参考文献書誌情報抽出のための有効な素性の検討と拡充2015

    • 著者名/発表者名
      松岡大樹, 太田 学, 高須 淳宏, 安達 淳
    • 学会等名
      第162回データベースシステム研究会
    • 発表場所
      芝浦工業大学
    • 年月日
      2015-11-26 – 2015-11-26
  • [学会発表] 書誌情報抽出および統合のためのテキストマイニング2015

    • 著者名/発表者名
      高須 淳宏
    • 学会等名
      人工知能学会合同研究会
    • 発表場所
      慶應義塾大学
    • 年月日
      2015-11-12 – 2015-11-14
    • 招待講演

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi