2012 Fiscal Year Research-status Report
Project/Area Number |
24700239
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | University of Tsukuba |
Principal Investigator |
上保 秀夫 筑波大学, 図書館情報メディア系, 准教授 (00571184)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 情報検索 / テストコレクション / 未来情報 |
Research Abstract |
本研究は、過去や現在に関する情報に焦点を当ててきた従来の情報検索に対し、未来に関する情報の検索技術および探索行動に焦点を当て、その評価基盤の構築を目的としている。 平成24年度は、文献調査とエンドユーザの実態調査を実施した。文献調査には2つの目的があり、1つ目の未来情報の探索に関する研究事例を調査では、関連研究としてサーチエンジンに投稿されるクエリの分類や時系列分析、表現の分析、繰り返し行動の分析等が多く行われていることが分かった。2つ目の未来情報に関するトピックの有無やその特徴の把握については、主要テストコレクションである、TREC、NTCIR、CLEF、INEX、MediaEvalの概要論文の網羅的収集を開始し、現在のところ220本が収集された。また、収集した概要論文の中に記載されているテストデータに関する記述分析を開始した。 エンドユーザの実態調査として意識調査と行動調査を行った。日常や仕事で行う情報探索のうち未来や将来に関する情報要求にはどのようなものがあるか、またどのような手段や経路を利用して未来情報を得ているかを解明することを目的とした意識調査では、20代から60代までの男女11名ずつ計110名に対し直近の検索体験に関する意識調査を行った結果、情報要求の時系列分布が明らかになった他、未来情報の探索と利用には時間差があることなどが明らかになった。未来情報を探索する上でどのようなクエリを使用したり、テーマごとによる未来情報検索の特徴を明らかにすることを目的とした行動分析は、未来情報に関する検索を実際に行ってもらいその体験を議論するというワークショップ形式での行動調査を10名に対し行った。その結果、未来検索におけるクエリ作成の特徴やシステム評価に使用できるトピック分類の草案を作成することができた。 業績の一部はTempWeb 2013 Workshopに採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成24年度の研究実施計画として、文献調査とエンドユーザの実態調査の2つを掲げた。文献調査には2つの目的があり、1つ目は、未来情報の探索に関するこれまでの研究事例を調査し、開発されている技術の特徴をまとめること、2つ目は、情報検索分野で構築された既存のテストコレクションに関する文献を収集/調査することで、未来情報に関するトピックの有無やその特徴を把握することであった。1つ目に関しては、サーチエンジンに投稿されるクエリの分類や時系列分析、表現の分析、繰り返し行動の分析等が多く行われていることが分かった。2つ目に関しては、主要テストコレクションである、TREC、NTCIR、CLEF、INEX、MediaEvalの概要論文の網羅的収集を開始し、現在のところ220本が収集された。また、収集した概要論文の中に記載されているテストデータに関する記述分析も開始した。 実態調査に関しても2つの目的を設定した。1つ目は、意識調査を行うことで日常や仕事で行う情報探索のうち未来や将来に関する情報要求にはどのようなものがあるか、またどのような手段や経路を利用して未来情報を得ているかを解明すること、2つ目は、行動分析を行うことで、未来情報を探索する上でどのようなクエリを使用したり、テーマごとによる未来情報検索の特徴を明らかにすることであった。1つ目に関しては、20代から60代までの男女11名ずつ計110名に対し直近の検索体験に関する意識調査を行い、その実態分析を行った。2つ目に関しては、未来情報の検索を実際に実施してもらいその体験を議論するというワークショップ形式での行動調査を10名に対し行った。その結果、未来検索におけるクエリ作成の特徴やシステム評価に使用できるトピック分類の草案を作成することができた。 以上のことより、本研究はおおむね順調に進展していると判断できる。
|
Strategy for Future Research Activity |
平成25年度は初年度の調査で得た知見を基にして未来情報の探索に関するテストコレクションを構築する。平成25年度で構築するテストコレクションは新聞記事を対象とし、最終的に構築を目指す100トピックの内、半分の作成を試みる。新聞記事を対象とする理由はこれまでの研究成果が多くあり、新しく構築テストコレクションとの比較を可能にするからである。構築の手順は以下の通りである。 (A) 初年度の調査を基にして60~70のトピックを考案する。(B) 次にNTCIRの新聞記事コレクションを代表的な検索システム(TerrierやApache Solr)を用いて索引付けする。(C) その各システムが提供する複数のランキング手法を用いて各トピックごとに自動検索を行い、検索結果(文書)を収集する。(D) 平行して同じトピックを用いた人手による検索作業を被験者実験を通して行い、そこで検索された文書も収集する。(E) そして自動検索と人手検索で収集された文書群のレレバンス判定を行う。自動検索と人手検索の結果を統合することで再現率を高める工夫を行う。(F) 最後にレレバンス判定の結果、十分な数の適合文書(15~)が見つかったトピックのみをテストコレクションに含める。
|
Expenditure Plans for the Next FY Research Funding |
次年度の研究費の使用計画は、研究成果の発表および最新動向の情報収集として旅費を300千円計上し、また初年度の知見を基にしてテストコレクション用のトピックの作成を行うための作業として750千円計上する。その他、消耗品として150千円計上する。初年度から繰り越された分は、テストコレクション文献の内容分析、詳細行動分析、トピック作成作業代として使用する計画である。
|
Research Products
(1 results)