研究課題/領域番号 |
15K16096
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
図書館情報学・人文社会情報学
|
研究機関 | 静岡大学 |
研究代表者 |
綱川 隆司 静岡大学, 情報学部, 助教 (30611214)
|
研究協力者 |
梶 博行
小谷 亮太
村上 凌悠
西田 昌史
西村 雅史
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2017年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2016年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2015年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | Wikification / エンティティリンキング / Wikipedia / 多言語 / 情報組織化 |
研究成果の概要 |
テキスト中に現れる重要な固有表現等の語句にWikipedia記事を対応付けるwikificationタスクについて、他の言語版のWikipedia記事に含まれるリンクを日本語に変換する方法を提案し実証実験を行った。実験の結果、変換したリンク数の増加は確認されたもののリンク先の決定精度向上までには至らなかった。また、サブタスクであるアンカー抽出およびリンク先決定のそれぞれについて、新たな特徴量および共起語の抽象性に基づいた方法を提案し、それぞれ性能向上を確認した。
|
研究成果の学術的意義や社会的意義 |
テキストにWikipedia記事へのリンクを付与することにより、テキストの理解可能性を高めるのみならず、情報抽出等の自然言語処理タスクへの応用も期待される。本研究は、従来のWikipediaのリンク言語間変換の手法を発展させてwikificationに応用し、全言語のWikipediaのリンクデータを用いてwikificationの性能向上を図る方法を検討したものであり、リンク数を増加させることで新たなリンクの提案を一定の精度で行うことができる可能性を示した。
|