研究課題/領域番号 |
20K12027
|
研究機関 | 徳島大学 |
研究代表者 |
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (90509754)
|
研究分担者 |
北 研二 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
任 福継 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (20264947) [辞退]
吉田 稔 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 感性言語モデル / 感性的言語変換 |
研究実績の概要 |
本研究では、「誤解されやすい表現」を感性・意味の両面から解釈し、より一般的かつ認識されやすい表現に変換するモデルを構築することを目的としている。 本年度は、感性情報を考慮した言語モデルの改良、ユーザごとの性格を反映した言語モデルの構築、有害表現検出のための言語変換モデルの構築、対話における言語モデルの構築、について主に研究を行った。感性情報を考慮した言語モデルの改良では、従来の言語分散表現単体から抽出することが難しい感性情報について、順伝播型ニューラルネットワークを用いて感情の種類を分類するモデルを作ることで、感情抽出を試みた。学習済みネットワークにおける次元の値を重みとし、感情予測の結果からそれぞれの感情の種類と関係性の高い次元の抽出を行い、元の分散表現の類似度との比較を行った。 また,性格を反映した言語モデルの構築では,MBTI性格診断の結果を正解ラベルとして,文の分散表現を特徴量とした文から性格を予測するモデルを構築するモデルと,感性情報を考慮した言語モデルに基づいて得られた特徴量を追加することで,性格パターンの予測の精度向上を行う研究を行った。有害表現検出のための言語変換モデルでは,BERTの事前学習済みのモデルをファインチューニングすることで有害・無害・スパムの3値分類を行い,MASK言語モデルによって有害表現から無害な表現への置換候補を予測する研究を行った。対話における言語モデルとして,対話中の感情を推定することで,対話の破綻現象を検出するモデルの構築に,感情を考慮した言語モデルを応用した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
感性的言語モデルの改良…本年度は、言語分散表現に基づく感性的言語モデルを改良するために追加で被験者アンケートを実施した。このアンケート結果による評価を行い、前年度に比べて、高い精度での感性的言語モデルが構築できた。具体的には、重みを用いる手法では、約82%の正答率で、同一感情を持つ感情語を出力できることが明らかとなった。 性格モデル…感性的言語モデルをもとに、性格診断手法であるMBTIの16種類の性格パターンを分類するモデルを作成し、感情と感情ベクトルの中間表現を特徴量として、各指標ごとの2値分類評価実験の結果、通常のBag of Wordsに基づく手法や、Word2vecによる分散表現に基づく手法よりも高い性能を達成した。この研究成果について、自然言語処理に関する国際会議PACLICにおいて研究発表した。 有害表現検出のための言語モデル…有害表現が含まれる発話文を、BERTによるテキスト分類器を用いて検出し、有害表現の箇所をマスク言語モデルを用いて変換する手法を提案した。この手法により、有害表現を無害な表現に置換できることが分かったが、一部、意味内容が大きく変わってしまう問題が見つかった。 対話における言語モデル…対話破綻の検出を行うために、対話における言語からの感情推定モデルを用いて、システム-ユーザ間の感情のベクトル距離が大きくなる箇所を破綻箇所として検出できる独自のモデルを構築した。
|
今後の研究の推進方策 |
BERTによる有害表現変換がある程度有効であることが分かったため、今後は、誤解されやすい表現をより一般的な表現に置換するため、マスク置換の際に単語候補を意味及び感性的言語変換モデルにより絞り込む手法について提案したい。 また、対話におけるコミュニケーション齟齬を検出するため、感性的言語変換モデルを逆方向に用いる方法を検討する。具体的には、文脈ベクトルに感情表現や感情推定結果を加えたものを入力として、誤解を与えない適切な(感情・意味の文脈考慮がされている)応答文生成手法について研究する。
|
次年度使用額が生じた理由 |
年度末にアクセプトとなった国際ジャーナル論文の掲載費用の支払いについて事務手続きの期日に間に合わず,翌年度の支払いになったため,次年度使用額が生じた。これについて,当初の予定通り,ジャーナル論文掲載費用に用いる予定である。
|