• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Semantic Search by Big Data Learning

Research Project

Project/Area Number 18H03243
Research InstitutionKyoto University

Principal Investigator

田中 克己  京都大学, 情報学研究科, 名誉教授 (00127375)

Co-Investigator(Kenkyū-buntansha) 加藤 誠  京都大学, 国際高等教育院, 特定講師 (00646911)
山本 祐輔  静岡大学, 情報学部, 講師 (50625431)
角谷 和俊  関西学院大学, 総合政策学部, 教授 (60314499)
山本 岳洋  京都大学, 情報学研究科, 助教 (70717636)
大島 裕明  兵庫県立大学, 応用情報科学研究科, 准教授 (90452317)
莊司 慶行  青山学院大学, 理工学部, 助教 (30783039)
Adam Jatowt  京都大学, 情報学研究科, 特定准教授 (00415861)
Project Period (FY) 2018-04-01 – 2021-03-31
Keywords情報検索 / 検索エンジン / 機械学習 / 語の意味の分散表現 / ビッグデータ
Outline of Annual Research Achievements

(1)情報検索のための語の意味学習方式
意味類似する語の検索を実現するため、時代を横断した語のアナロジーを計算する手法(Word2Vec法で生成される意味空間の生成・変換方式)を開発した。3つの時代における語の関係性の推移律を考慮して変換行列を求める手法の開発(IEEE BigComp 2019国際会議論文)、Word2Vec法の文脈学習の「文脈」をアスペクトによって制限して検索する方式の開発 (ACM WSDM2019国際会議論文)を行った。形容詞(修飾語)を伴うエンティティ検索を実現するため、修飾語を伴うクエリに対する検索エンティティのランキング法を開発した。さらに、検索ユーザが達成したい実世界での「タスク」という意味情報を考慮した検索を実現するため、同じタスクを達成可能な行動群を代替行動と定義し、代替行動を質問応答コーパスから学習する方法を開発した。
(2)検索インタラクションデータ学習による検索要求の意味抽出
検索インタラクションデータから、情報収集に慎重な検索ユーザとそうでない検索ユーザを学習するための基礎調査として、ウェブ検索における信頼性の意識の差と実際の検索行動の関係分析に取り組んだ。具体的には、1491名のユーザに対するアンケート調査および検索ログを関連付けて分析し、ウェブ検索に対する意識の差がユーザが閲覧する文書の順位の分布に差があることなどを発見した(ACM CIKM 2018国際会議論文)。
(3)空間認知属性による地物エンティティ検索方式
ランドマークの周辺で発信されたツイート情報がランドマークを特徴付けるとの仮説に基づき、ランドマークを分散表現化するためのアルゴリズムLocation2Doc法を提案した(SocInfo 2018 国際会議論文)。これにより、地域や地物の用途や雰囲気をソーシャルメディアデータから抽出することが可能となった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

(1) 情報検索のための語の意味学習方式の研究では、語の種類(品詞)に応じた文脈学習法の確立を目指しているが、平成30年度は、名詞、形容詞、動詞句(タスク)の意味学習法について成果を得た。
(2) 検索インタラクションデータ学習による検索要求の意味抽出の研究では、利用者とシステムの間のインタラクションに着目し、インタラクションデータを分析する事により、信憑性や正確性の高い検索を行いたいという検索ユーザの意図を分析・抽出ができた。
(3) 空間認知属性による地物エンティティ検索方式の研究では、地物(建物,道路,領域など)のような空間的エンティティの意味が、その地物を含む周辺領域にあるとの仮説に基づいて、空間データの「文脈学習」を行う方式を開発した。

Strategy for Future Research Activity

(1) 情報検索のための語の意味学習方式の研究では、引き続き、語の種類(品詞)に応じた文脈学習法の開発を行うと共に、画像・映像の意味学習(深層学習)を行う方式の研究開発を行っていく。
(2) 検索インタラクションデータ学習による検索要求の意味抽出では、引き続き、検索利用者とシステムの間のインタラクション履歴データを学習して検索動作の「意味」を発見する研究を継続していく。
(3) 空間認知属性による地物エンティティ検索方式の研究では、空間データの文脈はその周辺領域であるとのアイデアをさらに強化していく。すなわち、地物の空間的な周辺を文脈と捉えて認知属性の文脈学習を行う方式の開発を続ける。

  • Research Products

    (11 results)

All 2019 2018

All Journal Article (9 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 9 results) Presentation (2 results)

  • [Journal Article] Transitivity of Transformation Matrices to Bridge Word Vector Spaces Over Time2019

    • Author(s)
      Katsurou Takahashi and Hiroaki Ohshima
    • Journal Title

      Proceedings of 2019 IEEE International Conference on Big Data and Smart Computing (BigComp)

      Volume: ISBN 978-1-5386-7789-6 Pages: 1-4

    • DOI

      10.1109/BIGCOMP.2019.8679169

    • Peer Reviewed
  • [Journal Article] ATAR: Aspect-based Temporal Analog Retrieval System for Document Archives2019

    • Author(s)
      Yating Zhang, Adam Jatowt, Sourav S Bhowmick, Yuji Matsumoto
    • Journal Title

      Proceedings of The 12th International Conference on Web Search and Data Mining (WSDM 2019)

      Volume: ISBN 978-1-4503-5940-5 Pages: 762-765

    • DOI

      10.1145/3289600.3290613

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Across-Time Comparative Summarization of News Articles2019

    • Author(s)
      Yijun Duan, Adam Jatowt
    • Journal Title

      Proceedings of The 12th International Conference on Web Search and Data Mining (WSDM 2019)

      Volume: ISBN: 978-1-4503-5940-5 Pages: 735-743

    • DOI

      10.1145/3289600.3291008

    • Peer Reviewed
  • [Journal Article] Entity Ranking for Queries with Modifiers Based on Knowledge Bases and Web Search Results2018

    • Author(s)
      Wiradee Imrattanatrai, Makoto P. Kato, Katsumi Tanaka, Masatoshi Yoshikawa
    • Journal Title

      IEICE Transactions

      Volume: 101-D(9) Pages: 2279-2290

    • DOI

      10.1587/transinf.2017EDP7372

    • Peer Reviewed
  • [Journal Article] Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training2018

    • Author(s)
      Bei Liu, Jianlong Fu, Makoto P. Kato, Masatoshi Yoshikawa
    • Journal Title

      Proceedings of the 26th ACM international conference on Multimedia

      Volume: ISBN: 978-1-4503-5665-7 Pages: 783-791

    • DOI

      10.1145/3240508.3240587

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Every Word has its History: Interactive Exploration and Visualization of Word Sense Evolution2018

    • Author(s)
      Adam Jatowt, Ricardo Campos, Sourav S. Bhowmick, Nina Tahmasebi, Antoine Doucet
    • Journal Title

      Proceedings of The 27th ACM International Conference on Information and Knowledge Management (CIKM 2018)

      Volume: ISBN: 978-1-4503-6014-2 Pages: 1899-1902

    • DOI

      10.1145/3269206.3269218

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Mining Alternative Actions from Community Q&A Corpus2018

    • Author(s)
      Suppanut Pothirattanachaikul, Takehiro Yamamoto, Sumio Fujita, Akira Tajima, Katsumi Tanaka and Masatoshi Yoshikawa
    • Journal Title

      Journal of Information Processing

      Volume: 26 Pages: 427-428

    • DOI

      10.2197/ipsjjip.26.427

    • Peer Reviewed
  • [Journal Article] Exploring People’s Attitudes and Behaviors Toward Careful Information Seeking in Web Search2018

    • Author(s)
      Takehiro Yamamoto, Yusuke Yamamoto and Sumio Fujita
    • Journal Title

      Proceedings of the 27th ACM International Conference on Information and Knowledge Management (CIKM 2018)

      Volume: ISBN: 978-1-4503-6014-2 Pages: 963-972

    • DOI

      10.1145/3269206.3271799

    • Peer Reviewed
  • [Journal Article] Location2Vec: Generating Distributed Representation of Location by Using Geotagged Microblog Posts2018

    • Author(s)
      Yoshiyuki Shoji, Katsurou Takahashi, Martin Martin J. Durst, Yusuke Yamamoto and Hiroaki Ohshima
    • Journal Title

      Proceedings of the 10th International Conference on Social Informatics (SocInfo 2018), LNCS, Springer

      Volume: 11186 Pages: 261-270

    • DOI

      10.1007/978-3-030-01159-8_25

    • Peer Reviewed
  • [Presentation] ゼロショット学習によるテキストからのエンティティプロパティ同定2019

    • Author(s)
      Wiradee Imrattanatrai,加藤 誠,吉川 正俊
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)
  • [Presentation] 分散表現空間の基底変換に基づく時系列横断の類義語トラッキング2019

    • Author(s)
      高橋 克郎, 大島 裕明
    • Organizer
      第11回データ工学と情報マネジメントに関するフォーラム(DEIM2019)

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi