研究課題
情報爆発時代と呼ばれる今日、インターネット上に発信された情報は, 発信者にも制御不能な形で流通することが少なくなく、一旦流通したこれらの情報はアンドゥーすなわち発信される前の状態に戻すことは通常不可能である。また、これらは膨大な他の情報に埋没しがちであるため、既存の手段で探し当てるのは容易でない。本課題では、とくに、人物や組織等に対する誹謗中傷、ならびに、災害、事故、事件などの風評に着目し、それらの発見を支援するための技術基盤として、情報検索および情報追跡手法を開発する。平成20年度は主に以下の基本技術の開発に取り組んだ。1.逐次的に配信される文書系列に対するトピック追跡問題のため、情報理論に基づく語の重みづけ法を開発し、従来手法と比較して有意な改善を実現した。2.ブログポスト間のハイパーリンクとブログボストの潜在トピックに着目して、ブログ空間における情報伝搬を解析する手法を開発し、現実のプログデータを用いた評価実験によって有効性を示した。3.人物名や地名などのエンティティ(固有表現)がタグ付けされた文書の集合から、エンティティ間の関係を示すネットワークを推測する手法を実現した。4.タグで構造化された文書の集合から推定した潜在トピックに基づいて、構造化文書を効果的に検索する手法を実現した。Wikipediaデータを用いた評価実験によって提案手法の有効性を示した。5.マルコフ確率場モデルに基づく語間依存性のモデルにより、自然言語文で表現された質問から構造化クエリを構築し、高精度なWeb検索を実現した。
すべて 2009 2008 その他
すべて 雑誌論文 (15件) (うち査読あり 15件) 学会発表 (6件) 備考 (1件)
電子情報通信学会論文誌 Vol.J92-D,No.3
ページ: 311-320
Advances in Knowledge Discovery and Data Mining : 12th Pacific-Asia Conference, PAKDD 2008 Vol.LNCS-5012
ページ: 705-714
Focused Access to XML Documents : 6th International Workshop of the Initiative for the Evaluation of XML Retrieval, INEX 2007 Vol. LNCS-4862
ページ: 279-292
Proceedings of the 2nd International Workshop on Data and Text Mining in Bioinformatics
ページ: 77-80
Proceedings of the 2nd ACM Workshop on Improving Non-English Web Searching
ページ: 55-62
IEICE Transactions on Information and Systems Vol.E91-D, No.11
ページ: 2589-2598
IPSJ Transactions on Databases Vol.1,No.3
ページ: 11-19
CD-ROM Proceedings of the 19th International Conference on Genome Informatics
ページ: 1-2
情報処理学会論文誌 : データベース Vol.1,No.1
ページ: 26-35
人工知能学会論文誌 Vol.23,No.6
ページ: 514-525
情報処理学会論文誌 : データベース Vol.1,No.3
ページ: 20-35
ページ: 272-283
New Frontiers in Applied Data Mining : PAKDD 2008 International Workshops
ページ: 75-86
Proceedings of the 2008 IEEE International Conference on Data Mining Workshops
ページ: 275-282
ページ: 301-309
http://www.prmir.scitec.kobe-u.ac.jp/