対話情報処理のための知識に基づく適応性・即応性の高い深層学習モデル

研究課題

研究課題/領域番号	21H03494
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	東京大学
研究代表者	吉永直樹東京大学, 生産技術研究所, 准教授 (90773961)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円) 2023年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円) 2022年度: 6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円) 2021年度: 6,890千円 (直接経費: 5,300千円、間接経費: 1,590千円)
キーワード	適応的言語処理 / 対話情報処理 / 深層学習 / 知識獲得
研究開始時の研究の概要	スマートスピーカーの普及やCOVID-19の流行に伴うコミュニケーションの電子化によって、対話形式の言語データが急増している。これらの対話情報は、対話システムのような古典的応用に留まらず、話者の心身状態の把握・改善など多様な応用を生み出すと期待される。本研究ではこれらの応用を視野に入れ、多様な話者・会話状況に適応可能で、即応的で会話の流れを妨げない、知識に基づく高速な対話処理基盤技術の研究を行う。
研究実績の概要	前年度の研究で得られた知見を踏まえて以下の研究を実施した。 (1) まず、学習データから抽出した知識を活用する言語理解・生成モデルの研究を行った。言語理解タスクでは、情報抽出タスクの一つである属性値抽出を対象とし、入力属性が取りうる値を学習データから検索して追加入力する手法を開発した。実験結果から、特に低頻度の事象に関して情報抽出精度が大きく改善することが分かった。続いて、長期間対話のための雑談応答生成モデルの研究を進めた。具体的には、ユーザと対話システム間で複数セッションの対話履歴を想定し、過去の対話履歴から検索した対話を文脈として追加入力する応答生成手法を開発した。提案手法の評価のため、X (旧Twitter) アーカイブから長期間対話データセットを構築し、このデータセットを用いた実験により、過去の対話履歴を検索・利用することの有効性を確認するとともに、応答に役立つ過去の対話を検索する上で、検索のキーとバリューを適切に設計することが重要であることを明らかにした。さらに、モデルに対話履歴の積極的な活用を促すため、履歴を復元するマルチタスク学習を組み合わせた雑談応答生成手法を考案し、その有効性を実験を通して確認した。 (2) 対話情報処理において重要となる、テキスト中のエンティティの理解を行うエンティティリンキング手法を開発した。具体的に、過去の学習データから学習されたエンティティリンキングモデルを、前年度開発したエンティティ検出手法で検出した新エンティティに適用できるようにするため、エンティティの出現文脈や定義文を利用してモデルを拡張する手法を考案した。 (3) 音声対話を扱う際にボトルネックとなる音声認識誤りについて、前後の文脈を考慮した音声認識誤り訂正手法を事前学習済みモデルを用いて実装し、その有効性を予備実験を通して確認した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本年度の研究開発により、複数の言語理解・生成タスクにおいて、知識を活用した深層学習モデルの有効性を確認した。また、テキスト中の実世界知識を適切に扱うためのエンティティリンキング手法も開発した。さらに、音声対話を適切に扱うための音声認識誤り訂正手法も考案して、その有効性を確認しており、全体として順調に進展している。
今後の研究の推進方策	今後は本年度の成果を踏まえて、より効率よく知識を活用する深層学習モデルの開発を行う。本年度得られた知見から、(1) 検索拡張型の深層学習モデルにおいては、検索の結果得られた知識に含まれるノイズが知識の効果的な活用を阻害することが分かったため、この点を改善する手法を開発する。また、(2) 知識検索自体のオーバーヘッドを削減し、対話情報処理に適したリアルタイム処理を行うため、記号処理の枠組みで深層学習の限界を越える高速化を実現する手法の開発も進める。並行して、(3) 実世界知識を扱うために、エンティティに関する世界知識をマイクブログ上の投稿を用いて逐次更新する手法についても合わせて検討を行う。 (1) 検索拡張型モデルの高度化: 情報抽出・雑談応答生成タスクを主なターゲットとして、よりタスクに有用な知識をテキストから動的に検索する手法の開発を行う。また、得られた知識を効率良く参照するメカニズムの検討を進める。 (2) 効率の良い知識検索及びその運用手法: 知識を検索し、入力を拡張する深層学習モデルでは、検索のコストがオーバーヘッドとなる。そこで、知識検索自体の効率化を進める。並行して、本体の深層学習モデルを記号処理に基づく効率の良いモデルで近似する手法についても検討を行う。 (3) テキストストリームからのエンティティ知識の獲得手法: 対話において頻繁に参照されるエンティティ知識は、日々発生し消滅するものである。これまで進めてきたエンティティの発生を検知する手法を補完するため、エンティティの消滅を検知する手法を開発する。

報告書

(2件)

2022 実績報告書
2021 実績報告書

研究成果
(31件)

すべて 2023 2022 2021

すべて雑誌論文 (12件) (うち国際共著 1件、査読あり 5件、オープンアクセス 8件) 学会発表 (16件) (うち国際学会 3件) 産業財産権 (3件)

[雑誌論文] ニューラル機械翻訳のためのノイズ寛容なアンカー学習2023
- 著者名/発表者名
  根石将人, 吉永直樹
- 雑誌名
  
  言語処理学会第29回年次大会発表論文集
  
  巻: 1 ページ: 2511-2516
- 関連する報告書
  2022 実績報告書
- オープンアクセス
[雑誌論文] 最長一致パターンに基づく高速・高精度な日本語形態素解析2023
- 著者名/発表者名
  吉永直樹
- 雑誌名
  
  言語処理学会第29回年次大会発表論文集
  
  巻: 1 ページ: 351-356
- 関連する報告書
  2022 実績報告書
- オープンアクセス
[雑誌論文] 雑談対話における会話継続予測に基づくユーザ適応的応答評価2023
- 著者名/発表者名
  蔦侑磨, 吉永直樹, 佐藤翔悦, 豊田正史
- 雑誌名
  
  言語処理学会第29回年次大会発表論文集
  
  巻: 1 ページ: 1957-1962
- 関連する報告書
  2022 実績報告書
- オープンアクセス
[雑誌論文] 情報検索に基づく応答復元とのマルチタスク学習に基づく長期間対話のための応答生成2023
- 著者名/発表者名
  髙﨑環, 吉永直樹, 豊田正史
- 雑誌名
  
  人工知能学会言語・音声理解と対話処理研究会（SLUD）第 97 回研究会
  
  巻: 1
- 関連する報告書
  2022 実績報告書
[雑誌論文] Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product Attribute Extraction2022
- 著者名/発表者名
  Shinzato Keiji, Yoshinaga Naoki, Xia Yandi, Chen Wei-Te
- 雑誌名
  
  Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)
  
  巻: 1 ページ: 227-234
- DOI
  10.18653/v1/2022.acl-short.25
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Entity Embedding Completion for Wide-Coverage Entity Disambiguation2022
- 著者名/発表者名
  Oba Daisuke, Yamada Ikuya, Yoshinaga Naoki, Toyoda Masashi
- 雑誌名
  
  Findings of the Association for Computational Linguistics: EMNLP 2022
  
  巻: 1 ページ: 6333-6344
- DOI
  10.18653/v1/2022.findings-emnlp.472
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Effective Dialogue-Context Retriever for Long-Term Open-Domain Conversation2022
- 著者名/発表者名
  Meguru Takasaki, Naoki Yoshinaga and Masashi Toyoda
- 雑誌名
  
  Proceedings of the 13th International Workshop on Spoken Dialogue Systems Technology
  
  巻: 1
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文書のスタイル一貫性の改善2022
- 著者名/発表者名
  京野長彦, 吉永直樹, 佐藤翔悦
- 雑誌名
  
  情報処理学会研究報告 NL-253
  
  巻: 1
- 関連する報告書
  2022 実績報告書
[雑誌論文] 前後の発話を文脈として考慮するニューラル音声認識誤り訂正2022
- 著者名/発表者名
  中村朝陽, 李聖民, 田村鴻希, 吉永直樹
- 雑誌名
  
  情報処理学会研究報告 NL-254
  
  巻: 1
- 関連する報告書
  2022 実績報告書
[雑誌論文] 長期間の過去文脈を効果的に活用した雑談対話システム2022
- 著者名/発表者名
  髙﨑環, 吉永直樹, 豊田正史
- 雑誌名
  
  第13回対話システムシンポジウム
  
  巻: 1
- 関連する報告書
  2022 実績報告書
[雑誌論文] Fine-grained Typing of Emerging Entities in Microblogs2021
- 著者名/発表者名
  Akasaki Satoshi、Yoshinaga Naoki、Toyoda Masashi
- 雑誌名
  
  Findings of the Association for Computational Linguistics: EMNLP 2021
  
  巻: 1 ページ: 4667-4679
- DOI
  10.18653/v1/2021.findings-emnlp.399
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Exploratory Model Analysis Using Data-Driven Neuron Representations2021
- 著者名/発表者名
  Oba Daisuke、Yoshinaga Naoki、Toyoda Masashi
- 雑誌名
  
  Proceedings of the Fourth BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP
  
  巻: 1 ページ: 518-528
- DOI
  10.18653/v1/2021.blackboxnlp-1.41
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[学会発表] Effective Dialogue-Context Retriever for Long-Term Open-Domain Conversation2023
- 著者名/発表者名
  Meguru Takasaki, Naoki Yoshinaga and Masashi Toyoda
- 学会等名
  The 13th International Workshop on Spoken Dialogue Systems Technology
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] ニューラル機械翻訳のためのノイズ寛容なアンカー学習2023
- 著者名/発表者名
  根石将人, 吉永直樹
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 最長一致パターンに基づく高速・高精度な日本語形態素解析2023
- 著者名/発表者名
  吉永直樹
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 雑談対話における会話継続予測に基づくユーザ適応的応答評価2023
- 著者名/発表者名
  蔦侑磨, 吉永直樹, 佐藤翔悦, 豊田正史
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] 情報検索に基づく応答復元とのマルチタスク学習に基づく長期間対話のための応答生成2023
- 著者名/発表者名
  髙﨑環, 吉永直樹, 豊田正史
- 学会等名
  人工知能学会言語・音声理解と対話処理研究会（SLUD）第 97 回研究会
- 関連する報告書
  2022 実績報告書
[学会発表] Simple and Effective Knowledge- Driven Query Expansion for QA-Based Product Attribute Extraction2022
- 著者名/発表者名
  Keiji Shinzato, Naoki Yoshinaga, Yandi Xia, Wei-Te Chen
- 学会等名
  The 60th Annual Meeting of the Association for Computational Linguistics
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] 文脈を考慮したニューラル音声認識誤り訂正2022
- 著者名/発表者名
  中村朝陽, 吉永直樹
- 学会等名
  NLP 若手の会第 17 回シンポジウム
- 関連する報告書
  2022 実績報告書
[学会発表] Multimodal Sentiment Classification using Modal- independent Classifiers2022
- 著者名/発表者名
  ティヤジャーモンナッタポン, 吉永直樹
- 学会等名
  NLP 若手の会第 17 回シンポジウム
- 関連する報告書
  2022 実績報告書
[学会発表] スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文書のスタイル一貫性の改善2022
- 著者名/発表者名
  京野長彦, 吉永直樹, 佐藤翔悦
- 学会等名
  情報処理学会第253回自然言語処理研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 前後の発話を文脈として考慮するニューラル音声認識誤り訂正2022
- 著者名/発表者名
  中村朝陽, 李聖民, 田村鴻希, 吉永直樹
- 学会等名
  情報処理学会第254回自然言語処理研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 長期間の過去文脈を効果的に活用した雑談対話システム2022
- 著者名/発表者名
  髙﨑環, 吉永直樹, 豊田正史
- 学会等名
  第13回対話システムシンポジウム
- 関連する報告書
  2022 実績報告書
[学会発表] Visually-Guided Named Entity Recognition by Grounding Words with Images via Dense Retrieval2022
- 著者名/発表者名
  Wang Yao, Naoki Yoshinaga
- 学会等名
  言語処理学会第28回年次大会 (NLP2022),
- 関連する報告書
  2021 実績報告書
[学会発表] Exploratory Model Analysis Using Data-Driven Neuron Representations2021
- 著者名/発表者名
  Oba Daisuke、Yoshinaga Naoki、Toyoda Masashi
- 学会等名
  The Fourth BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] オンライン会議の効率化に向けたリアルタイム対話要約における課題2021
- 著者名/発表者名
  中村朝陽，吉永直樹
- 学会等名
  NLP若手の会第16回シンポジウム
- 関連する報告書
  2021 実績報告書
[学会発表] 文脈化埋め込みを用いた言語学習者のための語義別例文検索システム2021
- 著者名/発表者名
  Joshua Tanner,吉永直樹
- 学会等名
  NLP若手の会第16回シンポジウム
- 関連する報告書
  2021 実績報告書
[学会発表] Visually-guided machine translation by grounding input words to the world via images2021
- 著者名/発表者名
  姚望, 吉永直樹
- 学会等名
  NLP若手の会第16回シンポジウム
- 関連する報告書
  2021 実績報告書
[産業財産権] 学習システム、属性値抽出システム、学習方法、及びプログラム2022
- 発明者名
  吉永直樹
- 権利者名
  吉永直樹
- 産業財産権種類
  特許
- 出願年月日
  2022
- 関連する報告書
  2022 実績報告書
[産業財産権] 言語処理装置、機械学習方法、推定方法及びプログラム2022
- 発明者名
  吉永直樹
- 権利者名
  吉永直樹
- 産業財産権種類
  特許
- 出願年月日
  2022
- 関連する報告書
  2022 実績報告書
[産業財産権] 情報処理装置、情報処理方法および情報処理プログラム2021
- 発明者名
  吉永直樹
- 権利者名
  吉永直樹
- 産業財産権種類
  特許
- 出願年月日
  2021
- 関連する報告書
  2021 実績報告書

対話情報処理のための知識に基づく適応性・即応性の高い深層学習モデル

研究代表者

吉永 直樹 東京大学, 生産技術研究所, 准教授 (90773961)

17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] ニューラル機械翻訳のためのノイズ寛容なアンカー学習2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 最長一致パターンに基づく高速・高精度な日本語形態素解析2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 雑談対話における会話継続予測に基づくユーザ適応的応答評価2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 情報検索に基づく応答復元とのマルチタスク学習に基づく長期間対話のための応答生成2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product Attribute Extraction2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Entity Embedding Completion for Wide-Coverage Entity Disambiguation2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Effective Dialogue-Context Retriever for Long-Term Open-Domain Conversation2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文 書のスタイル一貫性の改善2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 前後の発話を文脈として考慮するニューラル音声認識誤り訂正2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 長期間の過去文脈を効果的に活用した雑談対話システム2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Fine-grained Typing of Emerging Entities in Microblogs2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Exploratory Model Analysis Using Data-Driven Neuron Representations2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Effective Dialogue-Context Retriever for Long-Term Open-Domain Conversation2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] ニューラル機械翻訳のためのノイズ寛容なアンカー学習2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 最長一致パターンに基づく高速・高精度な日本語形態素解析2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 雑談対話における会話継続予測に基づくユーザ適応的応答評価2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 情報検索に基づく応答復元とのマルチタスク学習に基づく長期間対話のための応答生成2023

著者名/発表者名

学会等名

関連する報告書

吉永直樹東京大学, 生産技術研究所, 准教授 (90773961)

[雑誌論文] スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文書のスタイル一貫性の改善2022

[学会発表] スタイル分離に基づくスタイル変換と異常検知の同時学習に基づく文書のスタイル一貫性の改善2022