研究課題/領域番号 |
26280111
|
研究機関 | 筑波大学 |
研究代表者 |
宇津呂 武仁 筑波大学, システム情報系, 教授 (90263433)
|
研究分担者 |
吉岡 真治 北海道大学, 情報科学研究科, 准教授 (40290879)
乾 孝司 筑波大学, システム情報系, 助教 (60397031)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ディレクトリ・情報検索 / 多言語処理 / 情報要求観点 / 検索エンジン・サジェスト / 言語間比較・対照分析 |
研究実績の概要 |
本研究では,各言語の検索エンジン・サジェストおよび質問回答サイトを情報源として,特定の検索対象に対する情報要求観点,および,その観点 に関して得られる情報を収集する.そして,収集された情報を言語間で比較・対照分析することにより,他国と自国との間の文化・関心・ 意見の違いを発見する過程を支援するシステムを作成する.平成26年度は,以下の研究を行った. (1) 検索エンジン・サジェストを対象として,ウェブ検索者の情報要求観点を収集した.ここで,収集されるサジェ ストの多くは話題が重複し冗長なため,冗長性集約方式を二種類開発した.方式1では,各サジェストを情報要求観点として指定して収集したウェブページ集合に対してLDA等のト ピックモデルを適用して,ウェブページ集合の話題集約を行った後,情報要求観点として指定したサジェストそ のものを集約した.方式2では,各サジェストを情報要求観点として指定して収集した検索結果のスニペット間の類似度を用いてサジェスト間の類似度を定義し,この類似度を用いてサジェストの集約を行った. (2) ウェブ検索者の情報要求観点,および,その観点に関して得られる情報を収集するための情報源として,質問回答サイトを対象とした.(1)で収集したサジェストを情報要求観点として,各サジェストを含む質問回答事例を 収集した後,トピックモデルを適用して質問回答事例集合を集約した. (3) サジェストと質問回答事例の間で,ウェブ検索者の情報要求観点における差異の有無について分析した.具体的には,収集された情報要求観点,および,各情報要求観点のもとで収集される情報を定量的に比較した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究成果の概要で述べた通り,(1) 検索エンジン・サジェストにおける情報要求観点の収集と集約の方式を実現した.また,(2) 質問回答サイトからの情報の収集と集約を行った.さらに,(3) 検索エンジン・サジェストと質問回答事例を比較する方式を実現した.以上の研究に対して,第7回データ工学と情報マネジメントに関するフォーラム,学生プレゼンテーション賞を授与された.当初の計画通り,以上の課題を達成することができたため,概ね順調に進展している.
|
今後の研究の推進方策 |
平成27年度は,検索エンジン・サジェストを利用することにより,質問回答サイトおよびウェブからノウハウ知識を相補的に収集する方式を開発する.この方式においては,検索エンジン・サジェストを索引として収集される情報に加えて質問回答サイトから得られる情報を相補的に利用し,それらを混合して集約する. 平成28年度は,情報要求観点の言語間対照分析の研究を進める.具体的には,特定の検索対象に対して,ウェブ検索者が検索時に指定した情報要求観点,および,その観点に関して得られる情報に対して,利用者が比較・対照分析を行い,言語間の違いを発見する過程を支援するシステムを作成する.
|
次年度使用額が生じた理由 |
平成27年度開催の学会において,26年度の研究成果についての発表が確定したため,その学会における発表用費用を次年度に使用することとしたため.
|
次年度使用額の使用計画 |
平成27年度の学会において研究成果を発表するための費用として使用する.
|