2020 Fiscal Year Research-status Report
異なるコミュニティにおいて誤解されやすい表現の感性的言語変換に関する研究
Project/Area Number |
20K12027
|
Research Institution | The University of Tokushima |
Principal Investigator |
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (90509754)
|
Co-Investigator(Kenkyū-buntansha) |
北 研二 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
任 福継 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (20264947)
吉田 稔 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 感性的言語変換 / 感性表現 / 言語モデル / 分散表現 |
Outline of Annual Research Achievements |
本年度では,従来の意味分散表現では考慮することが難しかった感性的要素に着目し,感性の分析に特化した言語モデルを構築するために,データ収集と解析を主に実施した.具体的には,(1)感性を考慮した分散表現のベースとなる従来モデルの選定,(2)ターゲットとなる基底感性および感性ベクトルの定義,(3)SNS上からの言語データの収集,(4)感性を考慮した分散表現モデルの構築と評価を実施した.まず,(1)においては,実験的に,単語の意味分散表現として最もひろく使用されている,CBoWアルゴリズムによる単語分散表現モデルを選定した.これは,現在,深層ニューラルネットワークに基づく言語モデルの手法がいくつも考案されているが,モデルがシンプルな構造を持つニューラルネットワークを用いることで,結果の考察がしやすいと考えたからである.つぎに,(2)では,基底感性として,互いに対をなす10種類の感情(好-嫌),(褒-怒),(驚(positive)-驚(negative)),(喜-悲),(望-恐)を決定し,感情極性(ポジティブ,ネガティブ)に基づき5次元の感性ベクトルを定義した.このベクトルは,従来研究では定義されていなかったものであり,新規性がある.(3)では,SNS上から,感情表現を含んでいる発言を自動収集したテキストコーパスを収集した.ここでの感情表現は,既存の辞書である「感情表現辞典」に含まれる表現とした.(4)では,収集したコーパスをもとに,CBoWモデルにより単語分散表現を学習し,さらに,感性ベクトルをターゲットとしてニューラルネットワークを学習させることで,感性表現に特化した単語分散表現モデルを構築した.このモデルが出力した単語分散表現の正および負の値の絶対値をもとに,部分ベクトルを抽出することで新たな分散表現を作成し,アンケートに基づく正解データを用いて評価した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
コーパスの収集に予定よりも大幅に時間がかかったが,基盤となるコーパスの収集,感性ベクトルの定義,新たな分散表現の定義などが完了し,予定していた実験の大部分を行うことができた.データの収集後にアンケートを実施したが,計画していた時期よりも後ろにずれ込んでしまったため,十分な人数の被験者を確保することができなかった.
|
Strategy for Future Research Activity |
今年度実施できなかった分のアンケートを追加で行い,単語の分散表現モデルとして,CBoW以外のモデル(BERTなど)を用いてより精度の高い方法で分散表現モデルを構築する.今年度は,アンケートをExcelシートへの記入形式で行っていたが,回収率が低くなる原因となっていた.そのため,次年度は,アンケートの実施方法をオンライン(Webフォーム)で行えるように改良するとともに,他の研究グループにも協力を依頼し,被験者のさらなる拡充を行って,質・量ともに十分なデータの収集および解析をスムーズに進められるように計画する.
|
Causes of Carryover |
2020年度は,コロナウイルス感染拡大の影響を受けて,学会発表で使用する予定であった旅費および,被験者を対象とした対面でのアンケート実施の支出計画が無くなり,謝金に予定していた費用の一部が未使用になった.被験者実験やデータ整理,研究成果発表などに多少の遅れが生じてしまっているため,翌年度請求分と合わせて,主に被験者実験と学会発表(オンライン参加がメイン)に使用する予定である.
|