研究課題/領域番号 |
21K19818
|
研究機関 | 東京農工大学 |
研究代表者 |
藤田 桂英 東京農工大学, 工学(系)研究科(研究院), 准教授 (00625676)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
キーワード | テキストマイニング / 議論マイニング / 合意形成支援 / 交渉ダイアログ |
研究実績の概要 |
本研究では、人工知能が交渉という人間が行う高等なコミュニケーションを支援することを目指して、新たに交渉マイニング(Negotiation Mining)の確立を目指す。これまで交渉という枠組みでは、歩み寄りなどの交渉戦略が大きく影響するため、人工知能が重要な情報を自然言語による交渉ダイアログから抽出するための研究はほとんどなかった。そこで、交渉問題に関する構造がある程度明らかである場合を想定し、交渉の進行や合意の成否、交渉参加者の歩み寄りのポイントを自動的に実施できる手法を提案し、定量的、定性的評価を実施する。 交渉マイニングを教師あり学習に適用させるために、交渉ダイアログデータの収集および生成を行った。これまでの交渉に特化した自然言語対話コーパスは、問題設定が単純化されているうえに規模が小さいため、深層学習等には向いていない。そこで、既存コーパスより大規模でより複雑な交渉を扱ったデータセットをクラウドソーシング等で生成した。さらに、独自のアノテーションスキームを提案し、効率的かつ質の高いアノテーションを実施した。 一般的な自然言語の文書に対して重要な情報を抽出する既存研究は存在するが、交渉の場合抽出するためのスキーム(参加者の発言の種別や関係)は独自である。そこで、最新の深層学習モデルを中心に、交渉判定に有効な要素と構造情報(特に発言したユーザ情報)を生かした学習モデルを提案した。新たに、大規模な言語モデルであるBERTをFine Tuningするアプローチと交渉独自の流れのモデルであるConstrained flow取り入れたGRUによる分類・抽出手法を提案した。これらの提案手法により、大幅な性能向上を見込んでいる。 また、交渉支援システムへの応用を見据えてプロトタイプシステムの設計を検討を行なった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
1. 交渉ダイアログデータの収集および生成: 交渉マイニングの機械学習に役立てるために、交渉ダイアログデータの収集および生成を行った。これまでの交渉に特化した自然言語対話コーパスは、問題設定が単純化されているうえに規模が小さいため、深層学習等には向いていない。そこで、既存コーパスより大規模でより複雑な交渉を扱ったデータセットをクラウドソーシング等で生成した。 2. アノテーションの実施: 独自のアノテーションスキームを提案し、効率的かつ質の高いアノテーションを実施した。オファーおよびカウンターオファー、質疑応答、挨拶など自動交渉研究から想定される要素の種別のスキームとともに、質問-回答など各要素同士の関係スキームを新たに定義する。多人数でのアノテーションを実施し、アノテーション時に意見の齟齬が発生した場合は議論により決定するなど、質の高いタグつきコーパスの作成を行なった。 3-a. 自動判定および抽出手法の提案: 最新の深層学習モデルを中心に、交渉判定に有効な要素と構造情報(特に発言したユーザ情報)を生かした学習モデルとすることで大幅に精度向上を目指した。新たに、大規模な言語モデルであるBERTをFine Tuningするアプローチと交渉独自の流れのモデルであるConstrained flow取り入れたGRUによる分類・抽出手法を提案した。これらの提案手法により、大幅な性能向上を見込んでいる。
|
今後の研究の推進方策 |
今後は、各研究目標に関して、以下のように研究を進めていく。 1. 交渉ダイアログデータの収集および生成: 引き続き、既存コーパスより大規模で,より複雑な交渉を扱ったデータセットをクラウドソーシング等で生成する。 2. アノテーションの実施: 独自の提案したアノテーションスキームを改善し、効率的かつ質の高いアノテーションを実施する。 3-a. 自動判定および抽出手法の提案: 最新の深層学習モデルを中心に、交渉判定に有効な要素と構造情報(特に発言したユーザ情報)を生かした学習モデルとすることで大幅に精度向上を目指す。特に、BERTは自然言語の分類タスクで適切な入力を追加することで大幅に性能が向上することが近年の研究から知られており、それらの入力の特定に自動交渉の研究で得られた知見を活用する。ダイアログデータの自動判定や抽出に深層学習がかなり有効と言われているが、交渉ダイアログに対する検証は不十分であり、抽出するためのスキームを新たに定義する必要があるため、これまでの既存手法を単純に適用させるだけでは困難な可能性が高い。新たに、交渉独自の視点を考慮したテキストマイニングのスキームや分類・抽出手法を提案することで、大幅な性能向上が見込める。 3-b. アノテーションデータの解析による重要な要素の発見: 2で作成したアノテーションデータの解析から交渉に関する目的を達成するために重要な特徴を明らかにする。 4. 評価およびプロトタイプシステムの設計: 本研究の目的に対して定性的、定量的評価を行う。また、交渉支援システムへの応用を見据えてプロトタイプシステムの設計を検討する。
|
次年度使用額が生じた理由 |
本年度から研究を開始したため時間が足りず、新たに大規模な交渉ダイアログデータ作成とアノテーションを当該年度に実施することができなかった。また、交渉独自の視点を考慮したテキストマイニングのスキームや分類・抽出手法を提案する段階までしか進めることができず、評価が不十分であったため、当該年度に成果発表をするに至らなかった。以上から、次年度使用額が生じてしまった。 次年度に、当該年度に実施できなかった大規模な交渉ダイアログデータの作成とアノテーション、提案したアプローチの評価とその成果発表を実施し、当該年度未使用分の物品費、人件費、旅費、その他の項目を使用する計画である。
|