研究課題/領域番号 |
17K00324
|
研究機関 | 釧路工業高等専門学校 |
研究代表者 |
中島 陽子 釧路工業高等専門学校, 創造工学科, 准教授 (20217730)
|
研究分担者 |
プタシンスキ ミハウ 北見工業大学, 工学部, 准教授 (60711504)
桝井 文人 北見工業大学, 工学部, 教授 (80324549)
本間 宏利 釧路工業高等専門学校, 創造工学科, 准教授 (80249721)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 情報抽出 / 将来言及文 / 未来動向予測 / 意味役割 / 未来語 / 単語極性情報 |
研究実績の概要 |
本研究は,対象分野の専門知識を用いることなく,文を構成する形態パターンを用い少量の学習データで潜在的な将来言及文を抽出・分類できる,汎用性を備えた未来動向予測支援システムの開発を目的とする. 本年度は,未来動向予測支援システムの中核部である将来言及文獲得のための分類器の精度向上と汎用性の強化を実現し最適な分類器の構築,および,汎用性を備えた予測エンジンの開発に取り組んだ. 将来言及文獲得を行う分類器の精度向上には,将来言及文に使われる特徴的な語を未来語と定義し,形態パターンの要素(意味役割:動作主,動作など)に「未来語」を新たに追加し分類器を生成した.未来語は分野ごとに将来言及文1000文を用いて決定した.未来語を含まない未来言及文も存在するため,要素に未来語を考慮する学習と未来語を意味役割に置き換え学習する二段階学習構造による分類器の生成を試みた.各分類器の評価には,新たに収集したデータ1200文を用いて行い,H29年度の実験結果よりも約11ポイントの向上を確認した.分類器の汎用性強化と最適化実装は,ニュース記事の分野分類を参考に,昨年度取り組んだ科学技術分野の分類器に加え,国際,経済の分類器を追加した.分野ごとと分野共通の未来語の定義を行い汎用性を考慮した. 予測エンジン部は,実世界の問題に対応するために予測したい未来動向が[起きるか/起きないか/どちらともいえない]の回答を得る手法として,単語の極性が[ポジティブ/ネガティブ]であるかを表す日本語評価極性を用いた手法を実装し実験を行った. 予測エンジンの精度は,昨年度のプロトタイプ予測エンジンよりも分野混合動向予測問題の予測結果は23.9ポイント,分野別の予測結果は12.5ポイント高い結果が得られた. 最適な機械学習に関して言語処理学会第25回年次大会で発表,また,これまでの成果を論文誌に投稿中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成30年度は未来動向予測支援システムの中核部である,将来言及文獲得のための分類器の構築,および,予測エンジンの開発に取り組んだ.研究工程と進捗状況を以下に示す. (1) 複数コーパスからの形態パターンMoPs(Morpho semantic Patterns) の抽出実験: 更なる効果的なMoPs獲得を目指して,複数コーパスを利用しのMoPs生成による精度検証を行い,新聞記事コーパス以外のWebニュースや専門記事を学習用テキストとしたMoPs獲得の実験を行い,出力結果の精度比較や検証を行なった.(中島,本間,桝井) (2)将来言及文取得のための分類器の構築: 将来予測支援に必要な精度の高い有効的な将来言及文や潜在的な将来言及文を分類抽出するために,新しい知識として「未来語」の要素を追加し学習を行い分類器の生成を行なった.(中島,プタシンスキ) (3)予測エンジンの構築: 分類器により獲得した将来言及文を利用して,ユーザーに将来予測情報を提示する予測エンジンは,抽出された表層的な将来言及文,潜在的な将来言及文の形態パターンと関連動向情報を数量化することで評価値の大きな順に予測結果を提示し,さらに,将来言及文に日本語評価極性情報と関連動向情報を定式化し,予測したい未来動向の結果は複数選択肢を用意しそれらの尤度を算出することで予測を行う一連を実装し,検証を行なった.(中島,本間,桝井) 未来動向予測支援システムの最適化へ向けて,申請者全員により研究工程(1)~(3)の検証結果に対し各工程の問題点や改善点の洗い出しを行なった.
|
今後の研究の推進方策 |
平成31年度は,将来言及文抽出精度,予測エンジンの予測精度を向上させるため,各過程において取得結果の検討・精査,およびアルゴリズムの改善を行い,未来同行予測システムの構築を行い,実世界における予測問題と データを用い未来同行予測システムの実用性の検証を行う. 予測エンジンの利用する最適化関数やその解法の見直しを根本から行うことで問題解決をはかる.研究工程は次に述べる(1)~(3)により実施する.(1) 未来動向予測システムの構築:これまでに実現した意味役割付与機構,形態パターン導出機構,未来言及形態パターン導出機構,将来言及文取得の分類器,予測エンジンを組み合わせ,将来動向予測システムを実現させる. (2) 未来動向予測実験と評価:予測支援システムの精度向上のため,将来言及文と出力結果の因果検証,統計的 データを併用した予測実験,未来動向予測支援システムの出力結果と妥当性の検証を行う. (3) 将来イベント(動向)予測の実問題への応用の検討:実問題への応用として,例えば,自動車販売関連記事から自動車業界の景気予測などの経済予測 (1年,5年,10年) や大統領選挙などの政権に関する予測を行い,検証を行う. 以上の研究を遂行する際には,平成30年度に洗い出した解決すべき課題である二点についても考慮する. ・将来言及文の分類器精度向上のために,時間情報と文の述語になる動詞を要素として学習させる.・予測エンジン部において,複数コーパスを利用する部分で国の動向を考慮できるように政府が刊行している白書などを利用する. 申請者全員で今年度の推進方策を確認し,以上に述べた計画を遂行する.最終報告は論文誌などに発表する形で行うことを予定している.
|
次年度使用額が生じた理由 |
(1) 将来言及文分類実験において,複数コーパスを利用するためそのうちの1種類として経済新聞コーパスを採用することにしたが,契約が平成31年4月からの契約となることで差額が生じた.契約済みである.(2) 論文誌への投稿料を考えていたが次年度に使用する見込みである.(3) 旅費に関して出張先の場所や日程の都合上残額が生じた.次年度は旅費や論文投稿料などの一部として使用する.
|