• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

半教師あり深層学習を用いた語義曖昧性解消

研究課題

研究課題/領域番号 18K11422
研究機関茨城大学

研究代表者

佐々木 稔  茨城大学, 理工学研究科(工学野), 講師 (60344834)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード語義曖昧性解消 / 半教師あり学習 / グラフベース手法
研究実績の概要

半教師ありディープラーニングに基づく語義曖昧性解消は大量の文書集合における単語の使用法と辞書の語義情報の両方を特徴として捉えるモデルとして期待されるが、これまでに2件の手法しか存在していない。しかし、これらの手法には「語義曖昧性解消をシンプルな半教師ありディープラーニングを使ったモデルで構築できないか」「少量の語義付き用例文を利用して語義の特徴を捉えたディープラーニングモデルを構築できないか」という未解決の課題が存在する。そこで、本研究は語義の意味区分を考慮したシンプルな半教師ありディープラーニングを用いた高精度な語義曖昧性解消システムの開発を行った。
開発した半教師あり語義曖昧性解消システムの有効性を評価するため、日本語の評価データであるSemeval2010日本語タスクを使用し、語義曖昧性解消実験を行った。その結果、開発したシステムは既存の教師あり語義曖昧性解消システムと比較して、語義識別の精度が0.52%向上した。シンプルなグラフベースの半教師あり深層学習手法によって、少量の語義付き用例文でも高い精度の語義識別モデルの構築を実証できたと考えられる。
また、日本語書き言葉均衡コーパス(BCCWJ)の各ジャンルにおける語義なし用例文を用いた語義曖昧性解消実験を行い,どのような語義なしデータの利用が有効なのか分析を行った。その結果、BCCWJ全ての用例文を追加した場合よりも精度が低くなった。扱ったジャンルの中で語義識別精度が最も高くなったのは雑誌(PM)の用例文を追加した時であった。これらの結果より、ジャンルを限定して語義なし用例文を追加しても、語義曖昧性解消の精度にあまり効果がないことが明らかとなった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

開発した半教師ありディープラーニングを用いた高精度な語義曖昧性解消システムは既存の教師あり語義曖昧性解消システムと比較して語義識別の精度が0.52%向上した。従って、「語義曖昧性解消をシンプルな半教師ありディープラーニングを使ったモデルで構築できないか」「少量の語義付き用例文を利用して語義の特徴を捉えたディープラーニングモデルを構築できないか」という2つの課題に対して、効果的な手法を確立することができた。さらに、既存の半教師あり語義曖昧性解消システムとの比較実験においても開発した手法の有効性を実証することができた。そのため、本研究課題は現在までおおむね順調に進展できていると判断する。
これまでのところ、開発したシステムは既存の半教師あり語義曖昧性解消システムと比較して有効性を実証することができたが、現在グラフ構造の構築に対する新しい手法を考案し、更なる精度改善に取り組んでいる。使用する素性を統一して評価することで、新しいグラフ構造を用いた手法の有効性について検証している段階である。

今後の研究の推進方策

開発したグラフニューラルネットワークを用いた語義曖昧性解消モデルにおけるグラフ学習用の隠れ層に対して、シソーラスや辞書の定義文などの外部情報を用いて語義識別の有効性を高めるように学習モデルの改良を行う。訓練データに少量しかない語義について用例文を追加することで、バランスの取れた語義また、用例文間の関係ではなく、単語の共起グラフを用いて外部情報を反映させるアプローチについても有用性の検討を行う。

次年度使用額が生じた理由

研究成果の発表を次年度に持ち越したために次年度使用額が生じることとなった。開発したシステムの有効性と信頼性を高めるための比較実験に遅れが生じたことにより、2019年度中に研究成果の発表を行うことができなかった。2020年度に遅れた研究成果を発表する予定で、そのための旅費として使用する計画である。

  • 研究成果

    (9件)

すべて 2020 2019

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (8件) (うち国際学会 2件)

  • [雑誌論文] Unsupervised All-words WSD Using Synonyms and Embeddings2019

    • 著者名/発表者名
      Suzuki Rui、Komiya Kanako、Asahara Masayuki、Sasaki Minoru、Shinnou Hiroyuki
    • 雑誌名

      Journal of Natural Language Processing

      巻: 26 ページ: 361~379

    • DOI

      https://doi.org/10.5715/jnlp.26.361

    • 査読あり
  • [学会発表] BERTの学習済みモデルを用いた用例文ペアの同義判定2020

    • 著者名/発表者名
      谷田部梨恵, 佐々木稔
    • 学会等名
      言語処理学会第26回年次大会
  • [学会発表] NTCIR-15 QA Lab-PoliInfo2 のタスク設計2020

    • 著者名/発表者名
      木村泰知, 渋木英潔, 高丸圭一 , 秋葉友良, 石下円香, 内田ゆず, 小川泰弘, 乙武北斗, 佐々木稔, 三田村照子, 横手健一, 吉岡真治, 神門典子
    • 学会等名
      言語処理学会第26回年次大会
  • [学会発表] Active Learning to Select Unlabeled Examples with Effective Features for Document Classification2019

    • 著者名/発表者名
      Minoru Sasaki
    • 学会等名
      The 10th International Conference on Computational Linguistics and Intelligent Text Processing
    • 国際学会
  • [学会発表] Ibrk at the NTCIR-14 QA Lab-PoliInfo Classification Task2019

    • 著者名/発表者名
      Minoru Sasaki, Tetsuya Nogami
    • 学会等名
      The Fourteenth NTCIR conference (NTCIR-14)
    • 国際学会
  • [学会発表] BERTモデルとニュースヘッドラインによるAI運用システムの試作2019

    • 著者名/発表者名
      史文愷, 細木唯以, 三好勝博, 江口潤一, 佐々木稔, 鈴木智也
    • 学会等名
      日本機械学会2019年茨城講演会
  • [学会発表] グラフニューラルネットワークを用いた半教師あり語義曖昧性解消2019

    • 著者名/発表者名
      谷田部梨恵, 佐々木稔
    • 学会等名
      情報処理学会 第241回自然言語処理研究会
  • [学会発表] 半教師あり語義曖昧性解消における各ジャンルの語義なし用例文の利用2019

    • 著者名/発表者名
      谷田部梨恵, 佐々木稔
    • 学会等名
      言語資源活用ワークショップ2019
  • [学会発表] 単語区切りの違いによるQAサイトの質問回答ペアの分類2019

    • 著者名/発表者名
      佐々木稔, 古宮嘉那子
    • 学会等名
      IDRユーザフォーラム2019

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi