2015 Fiscal Year Research-status Report
Project/Area Number |
15K00429
|
Research Institution | University of Shizuoka |
Principal Investigator |
大久保 誠也 静岡県立大学, 経営情報学部, 助教 (90422576)
|
Co-Investigator(Kenkyū-buntansha) |
池田 哲夫 静岡県立大学, 経営情報学部, 教授 (60363727)
風間 一洋 和歌山大学, システム工学部, 教授 (60647204)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
湯瀬 裕昭 静岡県立大学, 経営情報学部, 教授 (30240162)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | ウェブマイニング / 単語群検出 / 単語群構造化 / アノテーション |
Outline of Annual Research Achievements |
本研究の目的は、1)凝縮性の高い単語群の検出技術の確立とその特性や有効性の評価 2)凝縮性の高い単語群の構造化技術の確立とその結果の有用性評価 3)確立した検出技術と構造化技術の近代新聞検索サイト等での実証評価である。 1)については、凝縮性に基づく単語検出手法の有効性や特徴を、観光レビューサイトにおける記事の分析を通じて明らかとした。また、重要な単語を検出することを考える際、解析対象とするデータが、どのように生成されているか等の情報は重要である。本研究では特に、SNS やレビューの文章を実際に記述するユーザーに着目した。具体的には、解析対象となるデータにおいて重要な役割を果たすユーザーについて、その影響度を分析する手法を提案すると共に、実データに対して適用することにより、その有効性を明らかとした。 2)については、従来は一つの属性のみにより行われていたアノテーション付き可視化法を、多種情報に拡張するとともに、計算機実験によりその有効性を明らかとした。 3)については、本研究で得られた成果を基にした気づき型検索システムを構築し、近代新聞検索サイト(https://www.npoabc.jp/)において、2015年11月から2016年2月末にかけて実証実験を行った。実証実験により、構築したシステムの問題点や改善点を明らかとした。本実証実験は、現在も継続している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
目的1)については、計算機実験により、凝縮性検出手法が有効性を明らかにしている。加えて、ユーザーの影響度の評価手法という新しい手法を提案している。これらのことより、おおむね順調に進展していると考える。 目的2)については、従来の手法を拡張することにより、より妥当なアノテーションを行う手法を提案している。また、それらを可視化する手法を提案している。これらのことより、おおむね順調に進展していると考える。 目的3)については、近代新聞検索サイトにおける実証実験を行い、有効性や問題点を明らかとしている。また、実験を継続して行うと共に、他データでの実験についても検討している。これらのことより、おおむね順調に進展していると考える。
|
Strategy for Future Research Activity |
提案手法による単語群の検出や構造化が有効に働くか否かを明らかにするには、より多くの事例に対して適用することが必要である。そこで、目的1)ならびに2)については、他の特徴を持つデータや、より大規模なデータに適用することにより、提案手法の評価を行う。そして、得られた結果から、手法の改良や拡張を検討する。 加えて、ユーザーの影響度分析については、時系列データへの適用について検討していく。 目的3)については、引き続き近代新聞検索サイトにおける実証実験を続けると共に、広報紙等の他のデータへの適用について、検討ならびに実施を行う。加えて、文章データ以外への適用についても検討していく。
|
Causes of Carryover |
学会発表等で発表する予定だった内容を、紀要(査読付き論文)への投稿へと切り替えたため、旅費等が当初予定より減少した。
|
Expenditure Plan for Carryover Budget |
提案技術の特性などを分析するには、多様な実験設定での網羅的な評価が必要となる。今年度以降、多種多様かつ大規模なデータへの適用を検討していくため、大量の計算を要することが予想される。そこで、これらの計算機実験を実現する計算機環境を調達していく。 タイムリーかつ効果的に研究成果の情報発信を行うために、各々が積極的に国内外での研究発表を行っていく。
|
Research Products
(6 results)