• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

A Study on Digital Library System for Experimental Information Extraction, Visualization and Recommendation

Research Project

Project/Area Number 15H02789
Research InstitutionNational Institute of Informatics

Principal Investigator

高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)

Co-Investigator(Kenkyū-buntansha) 正田 備也  長崎大学, 工学研究科, 准教授 (60413928)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords電子図書館 / トピックモデル
Outline of Annual Research Achievements

学術情報からの情報抽出については、CRFを用いた書誌情報の抽出法を考案した。CRFの学習には通常一定量のラベル付きデータが必要になる。学習データは人手で作成する必要があり、作成コストの低減が求められる。本研究では、能動学習および転移学習法について検討を行い、サンプリング戦略の提案と評価実験を行った。その結果、サンプリング戦略を工夫することで必要となる学習データを減らすことができることを示した。
学術情報の分析に関しては、トピックモデルの効率的な推定アルゴリズムについて検討を行った。LDAにおける隠れ変数について、通常は一様分布を用いて初期化するところを、同じ文書内の他の隠れ変数の値に依存したヒューリスティックな手法によって初期化する手法を提案した。また、各文書でのトピック確率分布を、タイムスタンプや緯度経度などの時空情報に依存させた場合でも、変分ベイズのように最適化による推定をおこなうのではなく、サンプリングによって近似の少ない推定を実現できることを示した。
使われているサンプリング手法は、ロジスティック正規分布によって定義された離散的な確率分布ならどのような分布でも適用可能であり、今回は時空情報に依存したトピック確率の推定という具体的な応用に適用した。この研究を実施することにより、変分ベイズのような近似の入る推定に訴えなくても、スライスサンプリングさえ駆使すれば、様々なメタデータをトピックモデルにおいて利用できることが分かった。
学術情報の推薦については、推薦精度の向上をはかるため、コンテキスト依存推薦法を考案した。多様なコンテキストを組み合わせることによって精度の向上を図れるが、一方で計算コストが大きくなる。本研究では、粒子群最適化技術を用いることでコンテキストの効率的な選択を実現した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

全体的にほぼ計画通りに進んでいるが、実体抽出法の研究では、当初予定より多くのデータ収集が必要になることがわかったため、繰越を申請し、H28年度に学術情報の収集と評価を行なった。

Strategy for Future Research Activity

学術情報抽出については、引き続き、必要となる学習データの低減法に取り組む。また、本年は、書誌情報抽を行ったが、今後、他のタイプの情報抽出問題にも取り組む。
学術情報からのトピック抽出については、本年度に引き続き学習アルゴリズムの高速化に取り組み、大規模な学術情報の分析を可能とする。
情報推薦については、学術情報中に現れる様々なエンティティに関する情報推薦法に向けて、研究を展開する。

  • Research Products

    (8 results)

All 2015 Other

All Int'l Joint Research (1 results) Journal Article (5 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 5 results) Presentation (2 results) (of which Invited: 1 results)

  • [Int'l Joint Research] チュラロンコン大学(タイ)

    • Country Name
      THAILAND
    • Counterpart Institution
      チュラロンコン大学
  • [Journal Article] Similar Subtree Search Using Extended Tree Inclusion2015

    • Author(s)
      Tomoya Mori, Atsuhiro Takasu, Jesper Jansson, Jaewook Hwang, Takeyuki Tamura, Tatsuya Akutsu
    • Journal Title

      IEEE Transactions on Knowledge and Data Engineering

      Volume: 27 Pages: 3360 - 3373

    • DOI

      10.1109/TKDE.2015.2457922

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Bayesian Probabilistic Model for Context-Aware Recommendations2015

    • Author(s)
      Padipat Sitkrongwong, Saranya Maneeroj, Pannawit Samatthiyadikun, Atsuhiro Takasu
    • Journal Title

      International Conference on Information Integration and Web-based Applications & Services

      Volume: (iiWAS 2015) Pages: 166 - 175

    • DOI

      10.1145/2837185.2837223

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Heuristic Pretraining for Topic Models2015

    • Author(s)
      Tomonari Masada, Atsuhiro Takasu
    • Journal Title

      Proc. of IEA/AIE 2015, Springer Lecture Notes in Computer Science

      Volume: 9101 Pages: 123 - 134

    • DOI

      10.1007/978-3-319-19066-2_34

    • Peer Reviewed
  • [Journal Article] Utilization of Multiple Sequence Analyzers for Bibliographic Information Extraction2015

    • Author(s)
      Atsuhiro Takasu, Manabu Ohta
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 9443 Pages: 222 - 236

    • DOI

      10.1007/978-3-319-25530-9_15

    • Peer Reviewed
  • [Journal Article] 少量学習データによる参考文献書誌情報抽出精度の向上2015

    • Author(s)
      川上 尚慶, 太田 学, 高須 淳宏, 安達 淳
    • Journal Title

      情報処理学会論文誌 データベース

      Volume: 8 Pages: 18 - 29

    • Peer Reviewed
  • [Presentation] CRFによる参考文献書誌情報抽出のための有効な素性の検討と拡充2015

    • Author(s)
      松岡大樹, 太田 学, 高須 淳宏, 安達 淳
    • Organizer
      第162回データベースシステム研究会
    • Place of Presentation
      芝浦工業大学
    • Year and Date
      2015-11-26 – 2015-11-26
  • [Presentation] 書誌情報抽出および統合のためのテキストマイニング2015

    • Author(s)
      高須 淳宏
    • Organizer
      人工知能学会合同研究会
    • Place of Presentation
      慶應義塾大学
    • Year and Date
      2015-11-12 – 2015-11-14
    • Invited

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi