研究課題/領域番号 |
21K19818
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 東京農工大学 |
研究代表者 |
藤田 桂英 東京農工大学, 工学(系)研究科(研究院), 准教授 (00625676)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2023年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2022年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | テキストマイニング / 議論マイニング / 合意形成支援 / 交渉ダイアログ / 交渉マイニング / 人工知能 |
研究開始時の研究の概要 |
本研究では、人工知能が交渉という人間が行う高等なコミュニケーションを支援することを目指して、新たに交渉マイニング(Negotiation Mining)の確立を目指す。交渉問題に関する構造がある程度明らかである場合を想定し、交渉の進行や合意の成否、交渉参加者の歩み寄りのポイントを自動的に実施できる手法を提案し、定量的、定性評価を実施する。また、交渉支援システムへの応用を見据えてプロトタイプシステムの設計を検討する。
|
研究実績の概要 |
本研究では、人工知能が交渉という人間が行う高等なコミュニケーションを支援することを目指して、新たに交渉マイニング(Negotiation Mining)の確立を目指す。これまで交渉という枠組みでは、歩み寄りなどの交渉戦略が大きく影響するため、人工知能が重要な情報を自然言語による交渉ダイアログから抽出するための研究はほとんどなかった。そこで、交渉問題に関する構造がある程度明らかである場合を想定し、交渉の進行や合意の成否、交渉参加者の歩み寄りのポイントを自動的に実施できる手法を提案し、定量的、定性的評価を実施する。 交渉マイニングを教師あり学習に適用させるために、交渉ダイアログデータの収集および生成を行った。これまでの交渉に特化した自然言語対話コーパスは、問題設定が単純化されているうえに規模が小さいため、深層学習等には向いていない。そこで、既存コーパスより大規模でより複雑な交渉を扱ったデータセットをクラウドソーシング等で生成した。さらに、独自のアノテーションスキームを提案し、効率的かつ質の高いアノテーションを実施した。 一般的な自然言語の文書に対して重要な情報を抽出する既存研究は存在するが、交渉の場合に抽出するためのスキーム(参加者の発言の種別や関係)は独自である。そこで、最新の深層学習モデルを中心に、交渉判定に有効な要素と構造情報(特に発言したユーザ情報)を生かした学習モデルを提案した。さらに、これまで作成した交渉ダイアログデータおよびそのアノテーションに対して、交渉ダイアログに対するデータ拡張手法を提案し、実際にデータ拡張を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
1. 交渉ダイアログデータの収集および生成: 機械学習を行うために交渉ダイアログデータの収集および生成を行った。これまでの交渉に特化した自然言語対話コーパスは、問題設定が単純化されているうえに規模が小さいため、深層学習等には向いていない。そこで、既存コーパスを自動拡張する手法を提案し、実際にデータ拡張を行った。 2. アノテーションの実施: 独自のアノテーションスキームを提案し、効率的かつ質の高いアノテーションを実施した。オファーおよびカウンターオファー、質疑応答、挨拶など自動交渉研究から想定される要素の種別のスキームとともに、質問-回答など各要素同士の関係スキームを新たに定義する。多人数でのアノテーションを実施し、アノテーション時に意見の齟齬が発生した場合は議論により決定するなど、質の高いタグつきコーパスの作成を行なった。さらに、拡張後のデータに対して、アノテーション情報を引き継ぐことに成功している。 3-a. 自動判定および抽出手法の提案: 最新の深層学習モデルを中心に、交渉判定に有効な要素と構造情報(特に発言したユーザ情報)を生かした学習モデルを拡張後のデータに適用とることで大幅に精度向上を目指した。 3-b. 作成したアノテーションデータの解析から交渉に関する目的を達成するために重要な特徴を明らかにするために、様々な解析を試みた。
|
今後の研究の推進方策 |
今後は、各研究目標に関して、以下のように研究を進めていく。 1. 交渉ダイアログデータの収集および生成: 引き続き、既存コーパスより大規模かつより複雑な交渉を扱ったデータセットをクラウドソーシング等で生成する。さらに、データ拡張手法の改良を続け、大規模な交渉ダイアログデータを作成する。 2. アノテーションの実施: 独自の提案したアノテーションスキームを改善し、効率的かつ質の高いアノテーションを実施する。 3-a. 自動判定および抽出手法の提案: 最新の深層学習モデルを中心に、交渉判定に有効な要素と構造情報(特に発言したユーザ情報)を生かした学習モデルとすることで大幅に精度向上を目指す。特に、BERTは自然言語の分類タスクで適切な入力を追加することで大幅に性能が向上することが近年の研究から知られており、それらの入力の特定に自動交渉の研究で得られた知見を活用する。 3-b. アノテーションデータの解析による重要な要素の発見: 2で作成したアノテーションデータの解析結果から交渉に関する目的を達成するために重要な特徴を明らかにする。これまでに、統計的な解析を中心に行ってきたが、今後、交渉理論に基づく解析や機械学習を取り入れた解析を行い、重要な要素の発見を目指す。 4. 評価およびプロトタイプシステムの設計: 本研究の目的に対して定性的、定量的評価を行う。また、交渉支援システムへの応用を見据えてプロトタイプシステムの設計を検討する。
|