2012 Fiscal Year Annual Research Report
Project/Area Number |
22700096
|
Research Institution | Kyoto University |
Principal Investigator |
ADAM Jatowt 京都大学, 情報学研究科, 准教授 (00415861)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | 時間情報 / 時間情報解析と獲得 / 将来関連情報 / 新鮮さによるサーチ結果のランキング |
Research Abstract |
昨年度は、ウェブ上の画像の時代を推定する方法の開発に取り組んだ。この方法は画像を入力データとしてとらえ、その画像が撮影された時代を推定するもので、撮影日時が判明している大量の画像コレクションと画像を比較することによって行われた。19~20世紀に撮影された画像が含まれている画像コレクションを用いてこの方法をテストした結果、この方法は人間の判断よりもはるかに優れた性能を持っていることがわかった。この成果はSPIRE2012で発表されている。 同様に、時代の変遷によって起こる言語の変化についての研究も行った。Googleブックスのデータセットとヒストリカルアメリカンイングリッシュコーパスを使用し、異なる十年間を取り出してそれぞれの時代に独特な英単語の数を比較した。この分析の結果はCIKMとJCDLで発表されている。長期間にまたがるドキュメントのコレクションを扱うためには、経時的な言語の変化を考慮することが重要であることから、このような分析は時間情報検索の改善において 効果的であるといえる。 また、歴史的文書の3つのコレクションを用いて時代の推移による読みやすさの変化の分析を行った。その結果、文書は過去数十年に比べて、最近の数十年で読みやすくなっていることが示された。 その他に、ユーザー調査に実施し、Web上のユーザーの検索活動を時間的な側面から分析を行った。110人に質問し、時間的情報を検索する必要性があるときのウェブ検索の最近の経験について18の質問に答えてもらった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度の研究計画についてはおおむね順調に進んでいるといえる。昨年度は画像の撮影された時代を推定する方法を開発を構築したところ、いくつかの画像コレクションでテストした結果、その精度の高さが証明されている。また、時代による言語の移り変わりを推定するために歴史的文書の大規模コレクションの解析を行い、時間的な性格を持つ大規模なデータから知識を抽出するためのアプローチをいくつか提案することができた。また、ウェブ上の検索パターンを分析するために110人のユーザーを対象とした調査を行うことができた。
|
Strategy for Future Research Activity |
今後の研究においては、ドキュメントが参照しているフォーカスタイムを検出する方法の開発に取り組むつもりである。フォーカスタイムの検出には日付データを含むドキュメントの大規模なコレクションをターゲットドキュメントと比較する必要がある。これによってフォーカスタイムの検出が評価可能となれば、あるドキュメントがわりと最近のものなのか遠い過去のものなのかを推定することが可能となる。 その他にも、検索エンジンに送信されたユーザークエリの時間的な意図を検出する方法の開発を進める予定である。
|
-
-
-
-
-
[Presentation] Temporal Web Image Retrieval
Author(s)
Gael Dias, Jose Moreno, Adam Jatowt and Ricardo Campos
Organizer
19th International Symposium on String Processing and Information Retrieval (SPIRE 2012)
Place of Presentation
Cartagena de Indias, Colombia
-
-