研究課題/領域番号 |
25280035
|
研究種目 |
基盤研究(B)
|
配分区分 | 一部基金 |
応募区分 | 一般 |
研究分野 |
マルチメディア・データベース
|
研究機関 | 北海道大学 |
研究代表者 |
吉岡 真治 北海道大学, 情報科学研究科, 准教授 (40290879)
|
研究分担者 |
神門 典子 国立情報学研究所, 情報社会相関研究系, 教授 (80270445)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
研究課題ステータス |
完了 (2015年度)
|
配分額 *注記 |
11,050千円 (直接経費: 8,500千円、間接経費: 2,550千円)
2015年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2014年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2013年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
|
キーワード | 情報検索 / 固有名抽出 / Linked Open Data / 多観点分析 |
研究成果の概要 |
本研究では、Wikipedia上のメタデータとして整理したDBPediaの情報を利用した固有名詞とそのタイプ(人名・地名・組織名など)の抽出を行うとともに、そのタイプの情報を考慮した情報検索に有用なインデックスについて検討を行い、固有名詞のタイプを観点(facet)として扱い、複数の観点の存在を考慮したfacet-biasedトピックモデルを提案した。また、Wikipediaの情報の一貫性をDBPediaの情報を用いて分析するためのツールであるWC3を作成し、具体的に、Wikipedia中に存在するメタデータのエラーや、カテゴリ付与の一貫性がかける事例などを指摘できることを確認した。
|