2015 Fiscal Year Annual Research Report
ウェブ検索における情報要求観点の言語間比較・対照分析システムの研究
Project/Area Number |
26280111
|
Research Institution | University of Tsukuba |
Principal Investigator |
宇津呂 武仁 筑波大学, システム情報系, 教授 (90263433)
|
Co-Investigator(Kenkyū-buntansha) |
吉岡 真治 北海道大学, 情報科学研究科, 准教授 (40290879)
乾 孝司 筑波大学, システム情報系, 准教授 (60397031)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ディレクトリ・情報検索 / 多言語処理 / 情報要求観点 / 検索エンジン・サジェスト / 言語間比較・対照分析 |
Outline of Annual Research Achievements |
本研究では,各言語の検索エンジン・サジェストおよび質問回答サイトを情報源として,特定のクエリ・フォーカスに対する情報要求観点,および,その観点に関して得られる情報を収集する.そして,収集された情報を言語間で比較・対照分析することにより,他国と自国との間の文化・関心・意見の違いを発見する過程を支援するシステムを作成する.平成27年度は,以下の研究を行った. (1) 平成26年度,「検索エンジン・サジェストにおける情報要求観点の収集と集約」の研究において,検索エンジン・サジェストを対象として,ウェブ検索者の情報要求観点を収集した.ここで,収集されるサジェ ストの多くは話題が重複し冗長なため,冗長性集約方式を二種類開発した.そのうち,特に,方式1の「トピックモデルを用いる方式: 各サジェストを情報要求観点として指定して収集したウェブページ集合に対してトピックモデルを適用して,ウェブページ集合の話題集約を行った後,情報要求観点として指定したサジェストそのものを集約する」方式を対象として,各トピックにおけるウェブ検索結果を集約する方式を開発した.この方式では,各トピックに対応するサジェストを利用して,サジェストを網羅する最少数のウェブ検索結果を提示する方式を開発し,従来方式の約2倍の集約率を達成した. (2) 検索エンジン・サジェストを利用することにより,質問回答サイトおよびウェブからノウハウ知識を相補的に収集する方式を開発した.この方式においては,検索エンジン・サジェストを索引として収集される情報に加えて質問回答サイトから得られる情報を相補的に利用し,それらを混合して集約することを実現した.特に,質問回答サイト以外の一般的ウェブページを情報源として,質問回答サイトのノウハウ知識を補充する新ノウハウ知識が収集できることを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究成果の概要で述べた通り,(1) 平成26年度の研究成果「検索エンジン・サジェストにおける情報要求観点の収集と集約」のうちの方式1「トピックモデルを用いる方式」の後段として,各トピックにおけるウェブ検索結果を集約する方式を開発した.また,(2) 検索エンジン・サジェストを利用することにより,質問回答サイトおよびウェブからノウハウ知識を相補的に収集する方式を開発した.以上の研究に対して,第8回データ工学と情報マネジメントに関するフォーラム,学生プレゼンテーション賞を授与された.当初の計画通り,以上の成果を達成することができたため,概ね順調に進展している.
|
Strategy for Future Research Activity |
平成28年度は,情報要求観点の言語間対照分析の研究を進める.具体的には,特定のクエリ・フォーカスに対して,ウェブ検索者が検索時に指定した情報要求観点,および,その観点に関して得られる情報に対して,利用者が比較・対照分析を行い,言語間の違いを発見する過程を支援するシステムを作成する.
|
Causes of Carryover |
平成28年度開催の学会において,27年度の研究成果についての発表が確定したため,その学会における発表用費用を次年度に使用することとしたため.
|
Expenditure Plan for Carryover Budget |
平成28年度の学会において研究成果を発表するための旅費等として使用する.
|
Research Products
(11 results)