2017 Fiscal Year Annual Research Report
Detection of Annotation Words and Construction of Structured Infomations based on Cohesiveness
Project/Area Number |
15K00429
|
Research Institution | University of Shizuoka |
Principal Investigator |
大久保 誠也 静岡県立大学, 経営情報学部, 講師 (90422576)
|
Co-Investigator(Kenkyū-buntansha) |
池田 哲夫 静岡県立大学, 経営情報学部, 教授 (60363727)
風間 一洋 和歌山大学, システム工学部, 教授 (60647204)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
湯瀬 裕昭 静岡県立大学, 経営情報学部, 教授 (30240162)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 類型化 / アノテーション / 時系列解析 |
Outline of Annual Research Achievements |
本研究の最終目的は、文章群を類型化すると共に、それらを可視化した結果にアノテーションワード(注釈語)を付与することにより、重要かつ特徴的な情報を自動抽出することである。そこで本研究では、1)凝縮性の高い単語群の検出技術の確立とその特性や有効性の評価、2)凝縮性の高い単語群の構造化技術の確立とその結果の有用性評価、3)確立した検出技術と構造化技術の近代新聞検索サイト等での実証評価、について取り組んでいる。 1)ならびに2)については、前年度までに、凝縮性に基づく重要単語検出方法を提案し、それを基とした類型化とアノテーションワードの付与手法も提案した。そして、有効性ならびに特長を、観光レビューサイトデータを対象として行った。また、これらのデータにおけるユーザーの影響度についての評価も行った。本年度は、従来までのデータに加え、映画レビューサイトのデータに対して、手法を適用する事により、各手法の更なる評価を行った。 3)については、近代新聞検索サイトにおける実証実験を前年度までに実施した。昨年度からは、単語群データ以外のデータへの適用について検討を行い、特に時系列データに対して、幾つかの類型化手法ならびに特長検出手法の確立を行った。 今年度は、市場データに対して幾つかの基本的な解析を行うと共に、時系列変化に注目した類型化を提案手法により行い、提案手法の評価を行った。 また、時系列変化に注目した類型化においては、特徴的な時系列変化が各集団の特長であり、文章群におけるアノテーションワードに相当するものであると言える。そこで、異常点等の時系列変化に注目した新たな類型化手法を考案し、幾つかのデータに対して適用することにより、その有効性の評価を行った。また、農業環境データに対しても時系列解析ならびに変化点抽出法を適用することにより、その有効性の評価を行った。
|
Research Products
(5 results)