• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

テキストの形態パターン情報を活用した汎用型未来動向予測支援システムの開発

Research Project

Project/Area Number 17K00324
Research InstitutionKushiro National College of Technology

Principal Investigator

中島 陽子  釧路工業高等専門学校, 創造工学科, 准教授 (20217730)

Co-Investigator(Kenkyū-buntansha) プタシンスキ ミハウ  北見工業大学, 工学部, 准教授 (60711504)
桝井 文人  北見工業大学, 工学部, 教授 (80324549)
本間 宏利  釧路工業高等専門学校, 創造工学科, 准教授 (80249721)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywords情報抽出 / 将来言及文 / 未来動向予測 / 意味役割 / 未来語 / 単語極性情報
Outline of Annual Research Achievements

本研究は,対象分野の専門知識を用いることなく,文を構成する形態パターンを用い少量の学習データで潜在的な将来言及文を抽出・分類できる,汎用性を備えた未来動向予測支援システムの開発を目的とする.
本年度は,未来動向予測支援システムの中核部である将来言及文獲得のための分類器の精度向上と汎用性の強化を実現し最適な分類器の構築,および,汎用性を備えた予測エンジンの開発に取り組んだ.
将来言及文獲得を行う分類器の精度向上には,将来言及文に使われる特徴的な語を未来語と定義し,形態パターンの要素(意味役割:動作主,動作など)に「未来語」を新たに追加し分類器を生成した.未来語は分野ごとに将来言及文1000文を用いて決定した.未来語を含まない未来言及文も存在するため,要素に未来語を考慮する学習と未来語を意味役割に置き換え学習する二段階学習構造による分類器の生成を試みた.各分類器の評価には,新たに収集したデータ1200文を用いて行い,H29年度の実験結果よりも約11ポイントの向上を確認した.分類器の汎用性強化と最適化実装は,ニュース記事の分野分類を参考に,昨年度取り組んだ科学技術分野の分類器に加え,国際,経済の分類器を追加した.分野ごとと分野共通の未来語の定義を行い汎用性を考慮した.
予測エンジン部は,実世界の問題に対応するために予測したい未来動向が[起きるか/起きないか/どちらともいえない]の回答を得る手法として,単語の極性が[ポジティブ/ネガティブ]であるかを表す日本語評価極性を用いた手法を実装し実験を行った.
予測エンジンの精度は,昨年度のプロトタイプ予測エンジンよりも分野混合動向予測問題の予測結果は23.9ポイント,分野別の予測結果は12.5ポイント高い結果が得られた.
最適な機械学習に関して言語処理学会第25回年次大会で発表,また,これまでの成果を論文誌に投稿中である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

平成30年度は未来動向予測支援システムの中核部である,将来言及文獲得のための分類器の構築,および,予測エンジンの開発に取り組んだ.研究工程と進捗状況を以下に示す.
(1) 複数コーパスからの形態パターンMoPs(Morpho semantic Patterns) の抽出実験: 更なる効果的なMoPs獲得を目指して,複数コーパスを利用しのMoPs生成による精度検証を行い,新聞記事コーパス以外のWebニュースや専門記事を学習用テキストとしたMoPs獲得の実験を行い,出力結果の精度比較や検証を行なった.(中島,本間,桝井)
(2)将来言及文取得のための分類器の構築: 将来予測支援に必要な精度の高い有効的な将来言及文や潜在的な将来言及文を分類抽出するために,新しい知識として「未来語」の要素を追加し学習を行い分類器の生成を行なった.(中島,プタシンスキ)
(3)予測エンジンの構築: 分類器により獲得した将来言及文を利用して,ユーザーに将来予測情報を提示する予測エンジンは,抽出された表層的な将来言及文,潜在的な将来言及文の形態パターンと関連動向情報を数量化することで評価値の大きな順に予測結果を提示し,さらに,将来言及文に日本語評価極性情報と関連動向情報を定式化し,予測したい未来動向の結果は複数選択肢を用意しそれらの尤度を算出することで予測を行う一連を実装し,検証を行なった.(中島,本間,桝井)
未来動向予測支援システムの最適化へ向けて,申請者全員により研究工程(1)~(3)の検証結果に対し各工程の問題点や改善点の洗い出しを行なった.

Strategy for Future Research Activity

平成31年度は,将来言及文抽出精度,予測エンジンの予測精度を向上させるため,各過程において取得結果の検討・精査,およびアルゴリズムの改善を行い,未来同行予測システムの構築を行い,実世界における予測問題と データを用い未来同行予測システムの実用性の検証を行う.
予測エンジンの利用する最適化関数やその解法の見直しを根本から行うことで問題解決をはかる.研究工程は次に述べる(1)~(3)により実施する.(1) 未来動向予測システムの構築:これまでに実現した意味役割付与機構,形態パターン導出機構,未来言及形態パターン導出機構,将来言及文取得の分類器,予測エンジンを組み合わせ,将来動向予測システムを実現させる. (2) 未来動向予測実験と評価:予測支援システムの精度向上のため,将来言及文と出力結果の因果検証,統計的 データを併用した予測実験,未来動向予測支援システムの出力結果と妥当性の検証を行う. (3) 将来イベント(動向)予測の実問題への応用の検討:実問題への応用として,例えば,自動車販売関連記事から自動車業界の景気予測などの経済予測 (1年,5年,10年) や大統領選挙などの政権に関する予測を行い,検証を行う.
以上の研究を遂行する際には,平成30年度に洗い出した解決すべき課題である二点についても考慮する.
・将来言及文の分類器精度向上のために,時間情報と文の述語になる動詞を要素として学習させる.・予測エンジン部において,複数コーパスを利用する部分で国の動向を考慮できるように政府が刊行している白書などを利用する.
申請者全員で今年度の推進方策を確認し,以上に述べた計画を遂行する.最終報告は論文誌などに発表する形で行うことを予定している.

Causes of Carryover

(1) 将来言及文分類実験において,複数コーパスを利用するためそのうちの1種類として経済新聞コーパスを採用することにしたが,契約が平成31年4月からの契約となることで差額が生じた.契約済みである.(2) 論文誌への投稿料を考えていたが次年度に使用する見込みである.(3) 旅費に関して出張先の場所や日程の都合上残額が生じた.次年度は旅費や論文投稿料などの一部として使用する.

  • Research Products

    (17 results)

All 2019 2018

All Journal Article (5 results) (of which Int'l Joint Research: 4 results,  Peer Reviewed: 5 results,  Open Access: 1 results) Presentation (11 results) (of which Int'l Joint Research: 4 results) Book (1 results)

  • [Journal Article] Brute Force Sentence Pattern Extortion from Harmful Messages for Cyberbullying Detection2019

    • Author(s)
      Michal Ptaszynski, Fumito Masui, Yasutomo Kimura, Rafal Rzepka, Kenji Arak
    • Journal Title

      Journal of the Association for Information Systems (JAIS)

      Volume: - Pages: -

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] An Optimal Parallel Algorithm for Constructing a Spanning Tree on Proper Circle Trapezoid Graphs2018

    • Author(s)
      Hirotoshi Honma, Yoko Nakajima, Shino Nagasaki, Atsushi Sasaki
    • Journal Title

      Journal of Applied Mathematics and Physics

      Volume: 6 Pages: 1649-1658

    • DOI

      10.4236/jamp.2018.68141

    • Peer Reviewed / Open Access
  • [Journal Article] Big data analytics - towards the enrichment of content tourism for revitalization of Japanese rural area2018

    • Author(s)
      Ali Bakdur, Fumito Masui and Michal Ptaszynski
    • Journal Title

      MATEC Web of Conferences

      Volume: 169 Pages: 2261-236X

    • DOI

      https://doi.org/10.1051/matecconf/201816901008

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Automatic Extraction of Harmful Sentence Patterns with Application in Cyberbullying Detection2018

    • Author(s)
      Michal Ptaszynski, Fumito Masui, Yasutomo Kimura, Rafal Rzepka, Kenji Arak
    • Journal Title

      Lecture Notes in Computer Science (LNCS)

      Volume: 10930 Pages: 349-362

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] The use of Genetic Algorithm to optimize Quantitative Learner's Motivation Model2018

    • Author(s)
      Pawel Lempa, Michal Ptaszynski, Fumito Masui
    • Journal Title

      Technical Transactions

      Volume: 4 Pages: 189-194

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] Comparison of Machine Learning Techniques for Classification of Information Types on Twitter2019

    • Author(s)
      Michal Ptaszynski, 桝井文人, 中島陽子, 早川博, 齊藤剛彦, 宮森保紀
    • Organizer
      言語処理学会第25回年次大会
  • [Presentation] 自然言語処理技術を応用したテキスト(会話)の話題特定2019

    • Author(s)
      小北凌大, 中島陽子, 本間宏利, 山本和英
    • Organizer
      言語処理学会第25回年次大会
  • [Presentation] 名詞動詞句補充問題における錯乱肢の自動生成2019

    • Author(s)
      小北凌大, 中島陽子, 本間宏利, 山本和英
    • Organizer
      言語処理学会第25回年次大会
  • [Presentation] ユーザ口コミレビューと成分情報を併用した商品リコメンドシステムの開発2019

    • Author(s)
      西村健斗, 岩淵莉央, 中島陽子, 秋葉友良
    • Organizer
      平成30年度先進的技術に関するシンポジウム
  • [Presentation] Applying Support Vector Machines to POS tagging of the Ainu Language2019

    • Author(s)
      Karol Nowakowski, Michal Ptaszynski, Fumito Masui, Yoshio Momouchi,
    • Organizer
      3rd Workshop on Computational Methods for Endangered Languages (CmputEL-3)
    • Int'l Joint Research
  • [Presentation] Identification of Harmful Ingredients of Cosmetics using User Comments2018

    • Author(s)
      Yoko Nakajima, Akiko Saito, Rio Iwabuchi, Hirotoshi Honma, Tomoyoshi Akiba
    • Organizer
      JSST Annual International Conference on Simulation Technology
    • Int'l Joint Research
  • [Presentation] Word n-gram based tokenization for the Ainu language2018

    • Author(s)
      Karol Nowakowski, Michal Ptaszynski, Fumito Masui
    • Organizer
      the International Workshop on Modern Science and Technology 2018 (IWMST 2018)
    • Int'l Joint Research
  • [Presentation] Preliminary Statistical Analysis of Emotional and Moral Impressions Associated with Buddhist Religious Terms2018

    • Author(s)
      Jagna Nieuwazny, Fumito Masui, Michal Ptaszynski, Rafal Rzepka, Karol Nowakowsk
    • Organizer
      the International Workshop on Modern Science and Technology 2018 (IWMST 2018)
    • Int'l Joint Research
  • [Presentation] A proposal for a unified corpus of the Ainu language2018

    • Author(s)
      Karol Nowakowski, Michal Ptaszynski, Fumito Masui,
    • Organizer
      情報処理研究報告NL237
  • [Presentation] 情報科学的コンテンツツーリズムのための店舗レビュークラスタリングの試み2018

    • Author(s)
      黒田英慈, 桝井文人, プタシンスキ・ミハウ, 升井洋志, 亀丸俊一, 前田康成, 岡村慎
    • Organizer
      観光情報学会第18回研究発表大会
  • [Presentation] 情報科学的コンテンツツーリズムにおけるアンケート結果の質的分析と考察2018

    • Author(s)
      斎藤健斗, 桝井文人, 西野寛明, 山本真史, 岩館健司, プタシンスキ ミハウ, 升井洋志, 亀丸俊一, 前田康成
    • Organizer
      観光情報学会第18回研究発表大会
  • [Book] Automatic Cyberbullying Detection: Emerging Research and Opportunities (Advances in Human and Social Aspects of Technology)2018

    • Author(s)
      Michal E. Ptaszynski, Fumito Masui
    • Total Pages
      180
    • Publisher
      Information Science Reference
    • ISBN
      9781522552499

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi