• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

実世界知識と言語知識に基づく処理過程の説明性を備えた文章変換計算機構

研究課題

研究課題/領域番号 19H04162
研究機関東北大学

研究代表者

鈴木 潤  東北大学, データ駆動科学・AI教育研究センター, 教授 (80396150)

研究分担者 松林 優一郎  東北大学, 教育学研究科, 准教授 (20582901)
乾 健太郎  東北大学, 情報科学研究科, 教授 (60272689)
研究期間 (年度) 2019-04-01 – 2022-03-31
キーワード自然言語処理 / 人工知能 / 機械学習 / 文章生成 / 解釈性 / 説明性
研究実績の概要

機械翻訳,文書要約,文章校正,対話システムといった,ある入力文章を事前の定義に基づいて別の文章に変換する「文章変換技術」として広く用いられている符号化復号化器に関して,その処理過程を人間が解釈でき,かつ,処理結果を人手により比較的容易に操作できる技術,及び,その基盤技術の構築に取り組んだ.
本年度の主要な成果は,学習データに現れない未知のデータを予測する際に,学習データ内のどの事例を根拠として予測を行なったのかを提示する事例ベースの方法論の考案である.予測時にどの事例を根拠として予測したかを提示することで,予測の信頼度を推し量ることができるようになる.これにより,従来の典型的な深層学習により得られたモデルよりも,人間が予測理由をはるかに把握しやすくなった.
また,上記主要な成果以外にも,モデル学習時に非明示的に活用されるサブネットワークに着目することで,モデル内の挙動や学習データ内の各事例の影響度を計算する方法論や,単語間の意味的な類似性を加味しつつ文間の類似度を適切に計算する方法論の構築などにも取り組んだ.更に,当該年度の計画にはない追加の成果として,文章変換技術の中でも社会的に広く注目されている対話システムに焦点を当て,文章変換の良さを計測する方法論を別々の観点から二種類考案した.タスクの評価指標や評価方法は,数値を用いて人間の直感に適合するように設計する必要があり,その設計はそれほど容易ではなく,非常に意義の高い成果である.これらの追加の成果は,今後構築する方法論の性能を評価する際の基盤技術として活用していく.
今年度も引き続き文章変換における処理の解釈に資する研究を継続し,人間がどのように情報を提示されるとより解釈が容易と感じるかといった検証も含めて推進する予定である.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

今年度の進捗は当初計画した二年目の成果は概ね実現し,さらに追加で当初計画外の新たな方法論の構築にも取り組んだ.
詳細では当初計画と異なる点がある.例えば当初は逐次変換処理方式を目論んでいたが,それに代わる方法論として隠れ変数モデル,および,事例ベースによる根拠提示方法を考案した.これは,技術革新が非常に早い昨今のAI関連研究では,世の中の技術の進歩や新たに得られた知見を素早く反映して更なる発展を目指す必要がある.この観点から,当初の計画通りに進まないのは仕方がないところもあると考えている.ただし,想定していた方法論とは異なっていても,当初計画にある「文章変換の処理過程を人間が理解できる形式で獲得する」という目的に変わりはなく,より自然かつ最新の情勢を加味した方式で研究目的を達成することを目指している.
研究成果としての論文投稿に関しては,自然言語処理分野における最難関国際会議に8本採録されている.これら事実から,研究成果は当該分野において国際的にも高く評価されており,また,年間で8本の採録は国際的にも十分多い成果として認知されている.
当初予定には含まれていなかった対話システムの評価指標および評価方法の研究に関しても,今後の考案する方法論を適切に評価して有意義な技術革新を促すことができると考えており,意義の高い研究成果と考えている.1年目,2年目の成果を活用し,更なる発展に期待が持てる結果が得られており,次年度も引き続き当初目的を達成するために必要な研究を進めていく.

今後の研究の推進方策

最終年度となるので,1年目,2年目に考案した方法論やそれらの開発段階で得た様々な知見を活用し,当初の計画通り文章変換の処理過程を解釈可能な方法論の構築を目指す.前年度と同様に,発展が早いAI関連分野を継続的にキャッチアップしながら,分野全体に蓄えられている知見を取り入れて,計画時よりもより適した方法論を逐次模索しながら研究を進める.
今年度は,人間が認知しやすい記号的な形態で示される知識を解釈性に活用する方法論を中心に更に解釈性を高めることを考える.当初計画通り,記号的に蓄えられている実世界知識や自然言語解析の処理結果を効果的に活用する方法論は,本課題の目的である人間が処理過程を理解するために用いる表現として非常に効果的と考えられる.それと同時に,昨今広く用いられるようになった,超大量のデータで学習された言語モデルも一つの外部知識とみなして活用する方法論の構築も考案する.また,これら全てを組み合わせて取り扱う包括的な仕組みも検討すべき重要な課題と考えている.
最後に,ここで取り扱う文章変換技術に関する解釈性を向上させる方法論を適切に評価する評価指標や評価方法も重要な検討課題であり,これらもあわせて検討していく.

  • 研究成果

    (20件)

すべて 2021 2020

すべて 雑誌論文 (12件) (うち査読あり 12件、 オープンアクセス 12件) 学会発表 (8件)

  • [雑誌論文] データ指向型アプローチによるクローズドブック質問応答2021

    • 著者名/発表者名
      鈴木 正敏, 松田 耕史, 大内 啓樹, 鈴木 潤, 乾 健太郎
    • 雑誌名

      自然言語処理

      巻: 28 ページ: 3--25

    • DOI

      10.5715/jnlp.28.3

    • 査読あり / オープンアクセス
  • [雑誌論文] Efficient Estimation of Influence of a Training Instance2020

    • 著者名/発表者名
      Sosuke Kobayashi, Sho Yokoi, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of SustaiNLP: Workshop on Simple and Efficient Natural Language Processing

      巻: 1 ページ: 41-47

    • DOI

      10.18653/v1/2020.sustainlp-1.6

    • 査読あり / オープンアクセス
  • [雑誌論文] Preventing Critical Scoring Errors in Short Answer Scoring with Confidence Estimation2020

    • 著者名/発表者名
      Hiroaki Funayama, Shota Sasaki, Yuichiroh Matsubayashi, Tomoya Mizumoto, Jun Suzuki, Masato Mita, Kentaro Inui
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop

      巻: 1 ページ: 237-243

    • DOI

      10.18653/v1/2020.acl-srw.32

    • 査読あり / オープンアクセス
  • [雑誌論文] Embeddings of Label Components for Sequence Labeling: A Case Study of Fine-grained Named Entity Recognition2020

    • 著者名/発表者名
      Takuma Kato, Kaori Abe, Hiroki Ouchi, Shumpei Miyawaki, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop

      巻: 1 ページ: 222-229

    • DOI

      10.18653/v1/2020.acl-srw.30

    • 査読あり / オープンアクセス
  • [雑誌論文] Instance-Based Learning of Span Representations: A Case Study through Named Entity Recognition2020

    • 著者名/発表者名
      Hiroki Ouchi, Jun Suzuki, Sosuke Kobayashi, Sho Yokoi, Tatsuki Kuribayashi, Ryuto Konno, Kentaro Inui
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics

      巻: 1 ページ: 6452-6459

    • DOI

      10.18653/v1/2020.acl-main.575

    • 査読あり / オープンアクセス
  • [雑誌論文] Encoder-Decoder Models Can Benefit from Pre-trained Masked Language Models in Grammatical Error Correction2020

    • 著者名/発表者名
      Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics

      巻: 1 ページ: 4248-4254

    • DOI

      10.18653/v1/2020.acl-main.391

    • 査読あり / オープンアクセス
  • [雑誌論文] Single Model Ensemble using Pseudo-Tags and Distinct Vectors2020

    • 著者名/発表者名
      Ryosuke Kuwabara, Jun Suzuki, Hideki Nakayama
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics

      巻: 1 ページ: 3006-3013

    • DOI

      10.18653/v1/2020.acl-main.271

    • 査読あり / オープンアクセス
  • [雑誌論文] Evaluating Dialogue Generation Systems via Response Selection2020

    • 著者名/発表者名
      Shiki Sato, Reina Akama, Hiroki Ouchi, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics

      巻: 1 ページ: 593-599

    • DOI

      10.18653/v1/2020.acl-main.55

    • 査読あり / オープンアクセス
  • [雑誌論文] Language Models as an Alternative Evaluator of Word Order Hypotheses: A Case Study in Japanese2020

    • 著者名/発表者名
      Tatsuki Kuribayashi, Takumi Ito, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics

      巻: 1 ページ: 488-504

    • DOI

      10.18653/v1/2020.acl-main.47

    • 査読あり / オープンアクセス
  • [雑誌論文] Word Rotator's Distance2020

    • 著者名/発表者名
      Sho Yokoi, Ryo Takahashi, Reina Akama, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)

      巻: 1 ページ: 2944-2960

    • DOI

      10.18653/v1/2020.emnlp-main.236

    • 査読あり / オープンアクセス
  • [雑誌論文] Filtering Noisy Dialogue Corpora by Connectivity and Content Relatedness2020

    • 著者名/発表者名
      Reina Akama, Sho Yokoi, Jun Suzuki, Kentaro Inui
    • 雑誌名

      Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)

      巻: 1 ページ: 941-958

    • DOI

      10.18653/v1/2020.emnlp-main.68

    • 査読あり / オープンアクセス
  • [雑誌論文] Attention is Not Only a Weight: Analyzing Transformers with Vector Norms2020

    • 著者名/発表者名
      Goro Kobayashi, Tatsuki Kuribayashi, Sho Yokoi, Kentaro Inui
    • 雑誌名

      Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP)

      巻: 1 ページ: 7057-7075

    • DOI

      10.18653/v1/2020.emnlp-main.574

    • 査読あり / オープンアクセス
  • [学会発表] 事例ベース依存構造解析のための依存関係表現学習2021

    • 著者名/発表者名
      大内啓樹, 鈴木潤, 小林颯介, 横井祥, 栗林樹生, 吉川将司, 乾健太郎
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] オープンドメイン質問応答における解答可能性判別の役割2021

    • 著者名/発表者名
      鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] 単語埋め込みの決定的縮約2021

    • 著者名/発表者名
      仲村祐希, 鈴木潤, 高橋諒, 乾健太郎
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] オープンドメインQAにおけるDPRの有効性検証2021

    • 著者名/発表者名
      加藤拓真, 宮脇峻平, 西田京介, 鈴木潤
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] 対話システムの矛盾応答の生成に対する脆弱性の分析2021

    • 著者名/発表者名
      佐藤志貴, 赤間怜奈, 大内啓樹, 鈴木潤, 乾健太郎
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] Langsmith: 人とシステムの協働による論文執筆2021

    • 著者名/発表者名
      伊藤拓海, 栗林樹生, 日高雅俊, 鈴木潤, 乾健太郎
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] ユーザ生成コンテンツの高品質な自動翻訳に向けた言語現象の体系的分析2021

    • 著者名/発表者名
      藤井 諒, 三田 雅人, 阿部 香央莉, 塙 一晃, 森下 睦, 鈴木 潤, 乾 健太郎
    • 学会等名
      2020年度人工知能学会全国大会
  • [学会発表] ニューラル対話応答生成のための言語非依存な低品質対話データフィルタリング法の提案と分析2021

    • 著者名/発表者名
      赤間 怜奈, 横井 祥, 鈴木 潤, 乾 健太郎
    • 学会等名
      2020年度人工知能学会全国大会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi