研究課題/領域番号 |
18H03243
|
研究機関 | 京都大学 |
研究代表者 |
田中 克己 京都大学, 情報学研究科, 名誉教授 (00127375)
|
研究分担者 |
加藤 誠 京都大学, 国際高等教育院, 特定講師 (00646911)
山本 祐輔 静岡大学, 情報学部, 講師 (50625431)
角谷 和俊 関西学院大学, 総合政策学部, 教授 (60314499)
山本 岳洋 京都大学, 情報学研究科, 助教 (70717636)
大島 裕明 兵庫県立大学, 応用情報科学研究科, 准教授 (90452317)
莊司 慶行 青山学院大学, 理工学部, 助教 (30783039)
Adam Jatowt 京都大学, 情報学研究科, 特定准教授 (00415861)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 情報検索 / 検索エンジン / 機械学習 / 語の意味の分散表現 / ビッグデータ |
研究実績の概要 |
(1)情報検索のための語の意味学習方式 意味類似する語の検索を実現するため、時代を横断した語のアナロジーを計算する手法(Word2Vec法で生成される意味空間の生成・変換方式)を開発した。3つの時代における語の関係性の推移律を考慮して変換行列を求める手法の開発(IEEE BigComp 2019国際会議論文)、Word2Vec法の文脈学習の「文脈」をアスペクトによって制限して検索する方式の開発 (ACM WSDM2019国際会議論文)を行った。形容詞(修飾語)を伴うエンティティ検索を実現するため、修飾語を伴うクエリに対する検索エンティティのランキング法を開発した。さらに、検索ユーザが達成したい実世界での「タスク」という意味情報を考慮した検索を実現するため、同じタスクを達成可能な行動群を代替行動と定義し、代替行動を質問応答コーパスから学習する方法を開発した。 (2)検索インタラクションデータ学習による検索要求の意味抽出 検索インタラクションデータから、情報収集に慎重な検索ユーザとそうでない検索ユーザを学習するための基礎調査として、ウェブ検索における信頼性の意識の差と実際の検索行動の関係分析に取り組んだ。具体的には、1491名のユーザに対するアンケート調査および検索ログを関連付けて分析し、ウェブ検索に対する意識の差がユーザが閲覧する文書の順位の分布に差があることなどを発見した(ACM CIKM 2018国際会議論文)。 (3)空間認知属性による地物エンティティ検索方式 ランドマークの周辺で発信されたツイート情報がランドマークを特徴付けるとの仮説に基づき、ランドマークを分散表現化するためのアルゴリズムLocation2Doc法を提案した(SocInfo 2018 国際会議論文)。これにより、地域や地物の用途や雰囲気をソーシャルメディアデータから抽出することが可能となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
(1) 情報検索のための語の意味学習方式の研究では、語の種類(品詞)に応じた文脈学習法の確立を目指しているが、平成30年度は、名詞、形容詞、動詞句(タスク)の意味学習法について成果を得た。 (2) 検索インタラクションデータ学習による検索要求の意味抽出の研究では、利用者とシステムの間のインタラクションに着目し、インタラクションデータを分析する事により、信憑性や正確性の高い検索を行いたいという検索ユーザの意図を分析・抽出ができた。 (3) 空間認知属性による地物エンティティ検索方式の研究では、地物(建物,道路,領域など)のような空間的エンティティの意味が、その地物を含む周辺領域にあるとの仮説に基づいて、空間データの「文脈学習」を行う方式を開発した。
|
今後の研究の推進方策 |
(1) 情報検索のための語の意味学習方式の研究では、引き続き、語の種類(品詞)に応じた文脈学習法の開発を行うと共に、画像・映像の意味学習(深層学習)を行う方式の研究開発を行っていく。 (2) 検索インタラクションデータ学習による検索要求の意味抽出では、引き続き、検索利用者とシステムの間のインタラクション履歴データを学習して検索動作の「意味」を発見する研究を継続していく。 (3) 空間認知属性による地物エンティティ検索方式の研究では、空間データの文脈はその周辺領域であるとのアイデアをさらに強化していく。すなわち、地物の空間的な周辺を文脈と捉えて認知属性の文脈学習を行う方式の開発を続ける。
|