研究課題
本年度は、Linked Open Dataの中心と位置付けられているDBPediaのメタデータの品質向上を目標として開発したWC3について、日本語化を行うとともに、日本語DBPediaの開発チームとのディスカッションを行うとともに、システムの公開を行っている。また、このLinked Open Dataから得られた固有名詞のクラス情報を利用して、人名、地名などのタイプ付きの固有名詞を抽出するシステムを作成した。また、これらのタイプ情報をファセットとして利用した文書群に対する文書生成モデルとして、特定のファセットに関連する単語を主に生成するトピックという考え方を導入したFacet biasedトピックモデルを提案した。また、このFacet biasedトピックモデルを用いたニュース記事のカテゴリ分類システムを提案し、このような固有名詞に関する情報を用いることが、従来型の、トピックモデルを用いるよりも、有意に分類性能を向上させることを確認した。また、このFacet biasedトピックモデルは、特許文書における、分析の観点と対象物といった特許マップで用いるような異なる観点についての同時クラスタリングが行える事を具体的な事例で確認した。さらに、世界中の新聞記事の報道の違い(興味・賛否など)を分析するNSContrastについて、ニュース記事のデータベースであるGDELTにより提供される1日15万記事以上の記事を対象として利用できるようにすることで、これまでのシステムでは、あまり分析のできなかった、アフリカやオセアニアといった地域のニュース記事についても分析を行えるように改良した。昨年度から行っているこの研究の成果については、人工知能学会の研究会優秀賞を受賞した。
27年度が最終年度であるため、記入しない。
すべて 2016 2015 その他
すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 2件、 オープンアクセス 1件) 学会発表 (6件) (うち招待講演 1件) 備考 (1件)
Proceedings of the First International Workshop on Recent Trends in News Information Retrieval co-located with 38th European Conference on Information Retrieval (ECIR 2016)
巻: - ページ: 63065
Proceedings of the 11th Intl. Conf. on Signal-Image Technology & Internet-Based Systems
巻: - ページ: 712-718
10.1109/SITIS.2015.26
http://wnews.ist.hokudai.ac.jp/wc3/