• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

テキストの形態パターン情報を活用した汎用型未来動向予測支援システムの開発

研究課題

研究課題/領域番号 17K00324
研究機関釧路工業高等専門学校

研究代表者

中島 陽子  釧路工業高等専門学校, 創造工学科, 准教授 (20217730)

研究分担者 プタシンスキ ミハウ  北見工業大学, 工学部, 准教授 (60711504)
桝井 文人  北見工業大学, 工学部, 教授 (80324549)
本間 宏利  釧路工業高等専門学校, 創造工学科, 准教授 (80249721)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード情報抽出 / 将来言及文 / 未来動向予測 / 意味役割 / 未来語 / 単語極性情報
研究実績の概要

本研究は,対象分野の専門知識を用いることなく,文を構成する形態パターンを用い少量の学習データで潜在的な将来言及文を抽出・分類できる,汎用性を備えた未来動向予測支援システムの開発を目的とする.
本年度は,未来動向予測支援システムの中核部である将来言及文獲得のための分類器の精度向上と汎用性の強化を実現し最適な分類器の構築,および,汎用性を備えた予測エンジンの開発に取り組んだ.
将来言及文獲得を行う分類器の精度向上には,将来言及文に使われる特徴的な語を未来語と定義し,形態パターンの要素(意味役割:動作主,動作など)に「未来語」を新たに追加し分類器を生成した.未来語は分野ごとに将来言及文1000文を用いて決定した.未来語を含まない未来言及文も存在するため,要素に未来語を考慮する学習と未来語を意味役割に置き換え学習する二段階学習構造による分類器の生成を試みた.各分類器の評価には,新たに収集したデータ1200文を用いて行い,H29年度の実験結果よりも約11ポイントの向上を確認した.分類器の汎用性強化と最適化実装は,ニュース記事の分野分類を参考に,昨年度取り組んだ科学技術分野の分類器に加え,国際,経済の分類器を追加した.分野ごとと分野共通の未来語の定義を行い汎用性を考慮した.
予測エンジン部は,実世界の問題に対応するために予測したい未来動向が[起きるか/起きないか/どちらともいえない]の回答を得る手法として,単語の極性が[ポジティブ/ネガティブ]であるかを表す日本語評価極性を用いた手法を実装し実験を行った.
予測エンジンの精度は,昨年度のプロトタイプ予測エンジンよりも分野混合動向予測問題の予測結果は23.9ポイント,分野別の予測結果は12.5ポイント高い結果が得られた.
最適な機械学習に関して言語処理学会第25回年次大会で発表,また,これまでの成果を論文誌に投稿中である.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成30年度は未来動向予測支援システムの中核部である,将来言及文獲得のための分類器の構築,および,予測エンジンの開発に取り組んだ.研究工程と進捗状況を以下に示す.
(1) 複数コーパスからの形態パターンMoPs(Morpho semantic Patterns) の抽出実験: 更なる効果的なMoPs獲得を目指して,複数コーパスを利用しのMoPs生成による精度検証を行い,新聞記事コーパス以外のWebニュースや専門記事を学習用テキストとしたMoPs獲得の実験を行い,出力結果の精度比較や検証を行なった.(中島,本間,桝井)
(2)将来言及文取得のための分類器の構築: 将来予測支援に必要な精度の高い有効的な将来言及文や潜在的な将来言及文を分類抽出するために,新しい知識として「未来語」の要素を追加し学習を行い分類器の生成を行なった.(中島,プタシンスキ)
(3)予測エンジンの構築: 分類器により獲得した将来言及文を利用して,ユーザーに将来予測情報を提示する予測エンジンは,抽出された表層的な将来言及文,潜在的な将来言及文の形態パターンと関連動向情報を数量化することで評価値の大きな順に予測結果を提示し,さらに,将来言及文に日本語評価極性情報と関連動向情報を定式化し,予測したい未来動向の結果は複数選択肢を用意しそれらの尤度を算出することで予測を行う一連を実装し,検証を行なった.(中島,本間,桝井)
未来動向予測支援システムの最適化へ向けて,申請者全員により研究工程(1)~(3)の検証結果に対し各工程の問題点や改善点の洗い出しを行なった.

今後の研究の推進方策

平成31年度は,将来言及文抽出精度,予測エンジンの予測精度を向上させるため,各過程において取得結果の検討・精査,およびアルゴリズムの改善を行い,未来同行予測システムの構築を行い,実世界における予測問題と データを用い未来同行予測システムの実用性の検証を行う.
予測エンジンの利用する最適化関数やその解法の見直しを根本から行うことで問題解決をはかる.研究工程は次に述べる(1)~(3)により実施する.(1) 未来動向予測システムの構築:これまでに実現した意味役割付与機構,形態パターン導出機構,未来言及形態パターン導出機構,将来言及文取得の分類器,予測エンジンを組み合わせ,将来動向予測システムを実現させる. (2) 未来動向予測実験と評価:予測支援システムの精度向上のため,将来言及文と出力結果の因果検証,統計的 データを併用した予測実験,未来動向予測支援システムの出力結果と妥当性の検証を行う. (3) 将来イベント(動向)予測の実問題への応用の検討:実問題への応用として,例えば,自動車販売関連記事から自動車業界の景気予測などの経済予測 (1年,5年,10年) や大統領選挙などの政権に関する予測を行い,検証を行う.
以上の研究を遂行する際には,平成30年度に洗い出した解決すべき課題である二点についても考慮する.
・将来言及文の分類器精度向上のために,時間情報と文の述語になる動詞を要素として学習させる.・予測エンジン部において,複数コーパスを利用する部分で国の動向を考慮できるように政府が刊行している白書などを利用する.
申請者全員で今年度の推進方策を確認し,以上に述べた計画を遂行する.最終報告は論文誌などに発表する形で行うことを予定している.

次年度使用額が生じた理由

(1) 将来言及文分類実験において,複数コーパスを利用するためそのうちの1種類として経済新聞コーパスを採用することにしたが,契約が平成31年4月からの契約となることで差額が生じた.契約済みである.(2) 論文誌への投稿料を考えていたが次年度に使用する見込みである.(3) 旅費に関して出張先の場所や日程の都合上残額が生じた.次年度は旅費や論文投稿料などの一部として使用する.

  • 研究成果

    (17件)

すべて 2019 2018

すべて 雑誌論文 (5件) (うち国際共著 4件、 査読あり 5件、 オープンアクセス 1件) 学会発表 (11件) (うち国際学会 4件) 図書 (1件)

  • [雑誌論文] Brute Force Sentence Pattern Extortion from Harmful Messages for Cyberbullying Detection2019

    • 著者名/発表者名
      Michal Ptaszynski, Fumito Masui, Yasutomo Kimura, Rafal Rzepka, Kenji Arak
    • 雑誌名

      Journal of the Association for Information Systems (JAIS)

      巻: - ページ: -

    • 査読あり / 国際共著
  • [雑誌論文] An Optimal Parallel Algorithm for Constructing a Spanning Tree on Proper Circle Trapezoid Graphs2018

    • 著者名/発表者名
      Hirotoshi Honma, Yoko Nakajima, Shino Nagasaki, Atsushi Sasaki
    • 雑誌名

      Journal of Applied Mathematics and Physics

      巻: 6 ページ: 1649-1658

    • DOI

      10.4236/jamp.2018.68141

    • 査読あり / オープンアクセス
  • [雑誌論文] Big data analytics - towards the enrichment of content tourism for revitalization of Japanese rural area2018

    • 著者名/発表者名
      Ali Bakdur, Fumito Masui and Michal Ptaszynski
    • 雑誌名

      MATEC Web of Conferences

      巻: 169 ページ: 2261-236X

    • DOI

      https://doi.org/10.1051/matecconf/201816901008

    • 査読あり / 国際共著
  • [雑誌論文] Automatic Extraction of Harmful Sentence Patterns with Application in Cyberbullying Detection2018

    • 著者名/発表者名
      Michal Ptaszynski, Fumito Masui, Yasutomo Kimura, Rafal Rzepka, Kenji Arak
    • 雑誌名

      Lecture Notes in Computer Science (LNCS)

      巻: 10930 ページ: 349-362

    • 査読あり / 国際共著
  • [雑誌論文] The use of Genetic Algorithm to optimize Quantitative Learner's Motivation Model2018

    • 著者名/発表者名
      Pawel Lempa, Michal Ptaszynski, Fumito Masui
    • 雑誌名

      Technical Transactions

      巻: 4 ページ: 189-194

    • 査読あり / 国際共著
  • [学会発表] Comparison of Machine Learning Techniques for Classification of Information Types on Twitter2019

    • 著者名/発表者名
      Michal Ptaszynski, 桝井文人, 中島陽子, 早川博, 齊藤剛彦, 宮森保紀
    • 学会等名
      言語処理学会第25回年次大会
  • [学会発表] 自然言語処理技術を応用したテキスト(会話)の話題特定2019

    • 著者名/発表者名
      小北凌大, 中島陽子, 本間宏利, 山本和英
    • 学会等名
      言語処理学会第25回年次大会
  • [学会発表] 名詞動詞句補充問題における錯乱肢の自動生成2019

    • 著者名/発表者名
      小北凌大, 中島陽子, 本間宏利, 山本和英
    • 学会等名
      言語処理学会第25回年次大会
  • [学会発表] ユーザ口コミレビューと成分情報を併用した商品リコメンドシステムの開発2019

    • 著者名/発表者名
      西村健斗, 岩淵莉央, 中島陽子, 秋葉友良
    • 学会等名
      平成30年度先進的技術に関するシンポジウム
  • [学会発表] Applying Support Vector Machines to POS tagging of the Ainu Language2019

    • 著者名/発表者名
      Karol Nowakowski, Michal Ptaszynski, Fumito Masui, Yoshio Momouchi,
    • 学会等名
      3rd Workshop on Computational Methods for Endangered Languages (CmputEL-3)
    • 国際学会
  • [学会発表] Identification of Harmful Ingredients of Cosmetics using User Comments2018

    • 著者名/発表者名
      Yoko Nakajima, Akiko Saito, Rio Iwabuchi, Hirotoshi Honma, Tomoyoshi Akiba
    • 学会等名
      JSST Annual International Conference on Simulation Technology
    • 国際学会
  • [学会発表] Word n-gram based tokenization for the Ainu language2018

    • 著者名/発表者名
      Karol Nowakowski, Michal Ptaszynski, Fumito Masui
    • 学会等名
      the International Workshop on Modern Science and Technology 2018 (IWMST 2018)
    • 国際学会
  • [学会発表] Preliminary Statistical Analysis of Emotional and Moral Impressions Associated with Buddhist Religious Terms2018

    • 著者名/発表者名
      Jagna Nieuwazny, Fumito Masui, Michal Ptaszynski, Rafal Rzepka, Karol Nowakowsk
    • 学会等名
      the International Workshop on Modern Science and Technology 2018 (IWMST 2018)
    • 国際学会
  • [学会発表] A proposal for a unified corpus of the Ainu language2018

    • 著者名/発表者名
      Karol Nowakowski, Michal Ptaszynski, Fumito Masui,
    • 学会等名
      情報処理研究報告NL237
  • [学会発表] 情報科学的コンテンツツーリズムのための店舗レビュークラスタリングの試み2018

    • 著者名/発表者名
      黒田英慈, 桝井文人, プタシンスキ・ミハウ, 升井洋志, 亀丸俊一, 前田康成, 岡村慎
    • 学会等名
      観光情報学会第18回研究発表大会
  • [学会発表] 情報科学的コンテンツツーリズムにおけるアンケート結果の質的分析と考察2018

    • 著者名/発表者名
      斎藤健斗, 桝井文人, 西野寛明, 山本真史, 岩館健司, プタシンスキ ミハウ, 升井洋志, 亀丸俊一, 前田康成
    • 学会等名
      観光情報学会第18回研究発表大会
  • [図書] Automatic Cyberbullying Detection: Emerging Research and Opportunities (Advances in Human and Social Aspects of Technology)2018

    • 著者名/発表者名
      Michal E. Ptaszynski, Fumito Masui
    • 総ページ数
      180
    • 出版者
      Information Science Reference
    • ISBN
      9781522552499

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi