2019 Fiscal Year Annual Research Report
Conversationalisation of Search Interaction Based on Verbalisation of Search Intents
Project/Area Number |
19H04418
|
Research Institution | University of Tsukuba |
Principal Investigator |
上保 秀夫 筑波大学, 図書館情報メディア系, 准教授 (00571184)
|
Co-Investigator(Kenkyū-buntansha) |
松林 麻実子 筑波大学, 図書館情報メディア系, 講師 (10359581)
于 海涛 筑波大学, 図書館情報メディア系, 助教 (30751052)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 情報検索 / 会話検索 |
Outline of Annual Research Achievements |
初年度の前半は、情報探索行動、検索エンジンのログ分析、検索アルゴリズム、コミュニティ質問サイトなどを対象とした文献の調査を行った。文献調査の目的は、2つあった。1つ目は、検索者に対するインタビュー調査や実験室実験における行動分析、検索エンジンのログ分析などから、ユーザが検索中に思考する可能性のある事例内容を収集することである。情報行動の分野では思考発話法などの手法を用いた検索中の思考内容について多くの知見があるため、それらを集中的に調査した。2つ目は最新の検索アルゴリズムや検索インタフェースの設計に関する文献から、システムの思考内容として言語表現化できるものを収集することである。文献調査は研究代表者と研究分担者が各々の専門領域を担当し、データ収集した後、類型化作業を行った。その結果、ユーザ主体の思考内容を60件、システム主体の思考内容を10件程度収集した。 初年度の後半は、収集を開始した検索思考内容の言語表現データベースの構築に着手した。まずは、ユーザ主体の60の思考内容について言語表現データの収集を実施した。言語表現データの収集は2つのクラウドソーシングサービスを用いて実施した。具体的には、収集した検索思考内容それぞれに対し、それらが使用されると想定される状況とその状況で望まれる検索行動の意図をクラウドワーカーに提示し、与えられた状況と意図を反映したサーチエンジンへのメッセージを作成してもらった。これらのメッセージを思考内容の言語表現データの基とした。各思考内容について400件ほどの言語表現データを収集した
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」に記述したとおり、文献調査、検索思考の収集、言語表現データの収集など初年度の研究実施計画で予定していた内容をおおむね達成できたため。
|
Strategy for Future Research Activity |
次年度の前半は、言語表現データベース構築を継続して、特にシステム主体の思考内容の増加と目安とした数の言語表現データの収集を完了させる。その結果、極端に言語表現データ数の少ない思考内容については、クラウドソーシング作業を追加で実施する。 言語表現データベースの構築と並行して、思考内容の推定分析を実施する。収集した言語表現と対応する思考内容ラベルを訓練データとして用いて、分類器を学習させる。この推定分析を通して、言語表現から推定が容易な思考内容やそのカテゴリーとそうでないものを明らかにする。 次年度の後半は、会話検索システムの開発に着手する。まずはバックエンドとなる情報検索システムの構築から始める。本研究課題では、同一のクエリを何度も検索システムに入力して動作検証を行う必要があるため、オープンソースの検索エンジンを使って、静的な文書コーパスを索引づけする。
|
Research Products
(3 results)