2017 Fiscal Year Annual Research Report
Securing reliability in extracting minor topics from the Web
Project/Area Number |
15K00426
|
Research Institution | Kyushu University |
Principal Investigator |
中藤 哲也 九州大学, 情報基盤研究開発センター, 助教 (20253502)
|
Co-Investigator(Kenkyū-buntansha) |
廣川 佐千男 九州大学, 情報基盤研究開発センター, 教授 (40126785)
池田 大輔 九州大学, 学内共同利用施設等, 助教授 (00294992)
山田 泰寛 島根大学, 総合理工学研究科, 助教 (50529609)
|
Project Period (FY) |
2015-10-21 – 2018-03-31
|
Keywords | 学術論文 / 引用分析 / 観光情報 / マイナートピック |
Outline of Annual Research Achievements |
昨年度までの研究成果から、今年度は分析対象をWeb上から収集した学術論文に限定し、マイナーなものを含む全ての論文に客観的な評価を与えるための手法に関する研究を継続した。 学術論文を分析・評価するために、今年度は主に次の3つの観点からアプローチを行った。(1)Web上の論文データベースに収集・蓄積されている各論文の情報のうちアブストラクトのみを対象にした分析を行い、後日に高い評価が得られる可能性のある論文を自動分類する。(2)論文が他の論文を引用する際の引用の意味を特定する事で論文間の関係を明らかにし、論文を評価するための補助情報とする。(3)論文の各著者の研究経歴を論文データから分析し、各論文における著者の位置付けを明らかにする。 また論文を分析する為の素性として、論文中の特徴語に関して(1)属性選択を用いた重要な特徴語の特定手法、(2)局所的な出現頻度を用いた複合語の重要性の判定手法、に関する研究を進めた。 3年間の研究の結果、主に次の2点に関する研究成果が得られた。(1)観光に関するブログ中に出現する語のうち、低頻度語の出現に関する状況を明らかにした。これはブログなどの文書からの情報抽出に利用可能な研究成果である。(2)Web上の学術論文に客観的な評価を与える幾つかの手法を提案した。これらにより、マイナーなトピックに関するものを含んだ論文に関してその信頼性を確保するために必要な技術が部分的にであるが構築できた。これらの研究成果により、更なる研究の進展が期待できる状況である。
|