研究課題/領域番号 |
15K20990
|
研究機関 | 東京工業大学 |
研究代表者 |
欅 惇志 東京工業大学, 大学院情報理工学研究科, 助教 (00733958)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
キーワード | 検索意図 / タスク推定 / クエリ / 品詞 / MobileClick |
研究実績の概要 |
検索システム利用者は情報要求を解決すべく,検索質問 (クエリ) を繰り返し修正しながら,タイトルや概要文を手がかりに選択した文書から,求める情報を探し出す.ユーザはこの過程に大きな無駄を感じているという報告からも,ユーザがクエリを入力すれば,各文書全体を閲覧することなく,直接的に求める情報を得ることができれば,Web 検索システムの利便性は飛躍的に向上する.また,近年,爆発的に増加傾向にある,モバイル端末による情報検索では,ディスプレイサイズの制約を考慮して情報表示を行う必要がある.これらの状況を考慮し,本研究では,ユーザが求める情報を,適切な形式と分量に整形して提示ことを目指す.
上記の目標を達成する上で,平成 27 年度は,ユーザが求める情報を提示する上で重要となる,ユーザの検索意図を特定することを目指した.より詳細に述べると,ユーザの検索意図は 20 種類のタスクタイプに分類されることが報告されており,タスクタイプごとに適切な検索手法は異なるため,クエリの正確なタスク推定に取り組んだ.クエリのタスク推定にはクエリの持つ各種情報を利用されることが一般的であり,そのうちの一つとしてクエリ語の品詞情報が多用されるが,既存のクエリ語の品詞推定手法は精度が低いことが問題となる.そこで,大規模コーパスの統計量を利用することで,正確なクエリ語の品詞推定手法を提案した.更に,事前に統計量を算出してデータベースに保存することで,正確かつ高速な品詞付与を実現した.
また,もう一方の目標である,適切な形式と分量への整形に関して,同様の目標に基づくタスクである MobileClick-2 に参加した. MobileClick-2 は国立情報学研究所主催の国際ワークショップである NTCIR-12 のタスクの一つであり,我々の採用した部分文書検索アプローチは高い精度で要約が可能であることを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
クエリのタスク推定を行う上で必要となるクエリ語の品詞付与において,高精度かつ高速な推定手法の提案を行った.これにより,高精度なクエリのタスク推定の実現が期待されるばかりではなく,高精度な情報検索にも応用可能であり,基礎的かつ有用な技術である.また,MobileClick-2 の iUnit Summarization Subtask において,国内外の著名な研究機関計 17 グループ中において最も高い精度を達成した.
これらの成果は,1 件の国際会議と 2 件の国内会議にて報告されている.以上より,概ね順調に進展していると判断する.
|
今後の研究の推進方策 |
提案したクエリ語の品詞推定手法を利用し,引き続き,高精度なクエリのタスクタイプの推定に取り組む.また,並行して,クエリのタスクタイプ推定後の,タスクごとに適切な形式を明らかにする.
|
次年度使用額が生じた理由 |
参加予定であった国際会議への参加ができなかったため予定よりも使用した予算が下回った.
|
次年度使用額の使用計画 |
平成 27 年度の成果を国際会議へ投稿中であり,平成 28 年度中に使用予定である.
|