2013 Fiscal Year Research-status Report
新情報の追加と書き換え技術を用いたサーベイ論文の自動作成
Project/Area Number |
25330263
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Hiroshima City University |
Principal Investigator |
難波 英嗣 広島市立大学, 情報科学研究科, 准教授 (50345378)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | テキスト要約 / 学術論文 / 引用データベース / 引用分析 / サーベイ論文 |
Research Abstract |
研究者数の増加、学問分野の専門分化と共に学術情報量が爆発的に増加している今日、研究者が入手できる論文の量も増える一方で、人間の処理能力の限界から、入手した論文全てに目を通し利用することが困難になっている。このような状況にあって、特定の研究分野に関連したサーベイ論文の必要性は高まる一方である。しかし、研究者が知りたい分野のサーベイ論文を見つけても、その論文が何年も前に執筆されていて、最新の研究動向を含んでいなかったり、そもそも当該分野のサーベイ論文自体が存在しなかったりすることもある。そこで、本研究では、サーベイ論文に新しい研究を追加することにより、最新の研究動向を含んだサーベイ論文の自動作成を目指している。そのための第一歩として、平成25年度は既存サーベイ論文をもとに、そこでは言及されていない新しい論文の検索を試みた。 今、サーベイ論文または専門書籍の特定のトピックに関する一部(節、章)sと、そこで言及されている論文集合Dをシステムの入力とし、sに追加すべき論文pを検出する、という課題について考える。一般に、論文集合D中の論文dとの共引用数の多い論文は、sとの関連性が高く、なおかつ重要性も高いと考えられる。また、ある論文に関する引用個所は、他の研究者がその論文に見出した関連性や新規性などの注目すべき点を示しており、引用箇所間の類似性が高ければ、対応する論文対の類似性、関連性が高いと考えられる。 以上の仮定に基づき、引用論文データベースCiteSeer約200万論文を用いて提案手法の有効性を確認するための実験を行った。また、比較手法として、sとの類似度の高い論文をサーベイ論文に追加すべき候補の論文として出力する手法を含む、いくつかの手法でも実験した。実験の結果、提案手法は比較手法よりも高い検出精度が得られることが分かった。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の予定では、平成25年度は、サーベイ論文の文脈に適合する最新論文の検索の実現が目標であった。しかし、実際には、平成26年度に実施予定であった検索された最新論文の重要度の評価についても着手しているため、当初の研究以上に進展していると考えることができる。
|
Strategy for Future Research Activity |
平成26年度は、引き続き、サーベイ論文の文脈に適合し、なおかつ重要度の高い論文の検出に取り組む。特に、ランキング学習など、機械学習に基づく手法についても検討する。また、平成27年度に予定していた既存サーベイ論文への最新論文の追加についても、26年度中に、一部着手する。サーベイ論文に追加すべき論文検出の実験に用いるデータセットの作成はすでに平成25年度中に完成している。また、既存サーベイ論文への最新論文の追加実験に用いるデータセットについても、概ね完成している。
|
Expenditure Plans for the Next FY Research Funding |
正解用データの作成方法を工夫することで、作成にかかる費用が大幅に減った。 研究成果の国際会議での発表や、より大規模なデータを扱うためのサーバの増強に使用する。
|
Research Products
(1 results)