2019 Fiscal Year Annual Research Report
Development of a versatile future trend prediction support system using morphosemantic patterns information of text data
Project/Area Number |
17K00324
|
Research Institution | Kushiro National College of Technology |
Principal Investigator |
中島 陽子 釧路工業高等専門学校, 創造工学科, 准教授 (20217730)
|
Co-Investigator(Kenkyū-buntansha) |
プタシンスキ ミハウ 北見工業大学, 工学部, 准教授 (60711504)
桝井 文人 北見工業大学, 工学部, 教授 (80324549)
本間 宏利 釧路工業高等専門学校, 創造工学科, 准教授 (80249721)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 自然言語処理 / 意味役割 / 将来言及文 / 未来動向予測支援 / 形態パターン / 機械学習 / 分類モデル |
Outline of Annual Research Achievements |
本研究は,対象分野の専門知識を用いることなく,文を構成する形態パターンを用い少量の学習データで潜在的な将来言及文を抽出・分類できる,汎用性を備えた未来動向予測支援システムの開発を目的とする. 本年度は,将来言及文抽出精度,予測エンジンの予測精度を向上させるため,各過程において検討・精査,およびアルゴリズムの改善を行い,未来動向予測システムの構築および,実世界における予測問題とデータを用いシステムの実用性の検証を行った. 将来言及文抽出機構の改良として,経済,国際,科学技術に加え政策分野の分類モデルの生成を行いニュースドメイン毎に適切な分類器を適応可能にし,入力とする将来言及文の精度向上に取り組んだ(中島,本間,桝井). 予測エンジン部の最適化,昨年度考案した日本語評価極性を用いた極性分類部分の改良を行った.実世界の問題に対応するために予測したい未来動向が[起きるか/起きないか/どちらともいえない]の回答を得る手法として,単語の極性が[ポジティブ/ネガティブ]であるかを表す日本語評価極性を用いた手法では日本語評価極性辞書にない単語が頻出すると判定できないという問題に対し,分野ごとに頻出単語を抽出し補い,極性判定を定式化し極性分類の精度を改善した(中島,プタシンスキ). これまでに実現した意味役割付与機構,形態パターン導出機構,未来言及携帯パターン導出機構,将来言及文分類モデル,予測エンジンを組合せ,将来動向予測システムを構築した.本システムの評価は,既存の「先見力検定」で出題された問題,結果が判明している実世界のイベントから我々が作成した未来予測問題を用いWebニュース記事を入力として実験を行った.全15問の平均正解率は約73%の正解率であり,前年度の実験結果を18%上回る結果を得た(申請者全員).成果はCognitive Systems Researchなどに掲載された.
|