研究課題/領域番号 |
17J02751
|
研究機関 | 慶應義塾大学 |
研究代表者 |
山本 眞大 慶應義塾大学, 理工学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2017-04-26 – 2019-03-31
|
キーワード | 道徳性 / Webデータ / 自然言語処理 / ニューラルネットワーク |
研究実績の概要 |
非道徳的発言自動検出のために、入力文に対する道徳的な善悪性を判断する研究を行い、従来研究よりも高い精度で道徳性の推定が可能であることを示した。 提案手法ではまず、大規模なWebデータから構文情報や言語的パタンを用いることにより、道徳性がラベル付けされたデータが自動獲得される。例えば、「人を褒めることは良い…(以下略)」のような文章からは「人を褒める」行為が善い行いであるというデータが獲得される。具体的には、あらかじめ評価表現(「良い」や「悪い」などの極性を表す表現)および、接続表現(「ことは」や「のは」などの接続を表す表現)を定義しておく。次に、各文に対して構文解析が行われ、接続表現が評価表現に係っているかが確認される。最後に、接続表現に係っている文が獲得される。なお、各文のラベルはあらかじめ定義されている評価表現を基に決定される。 自動獲得されたデータは訓練データとして機械学習モデルの学習に用いられる。機械学習モデルには、ロジスティック回帰モデルや、深層学習によるモデルなどが用いられる。特に深層学習モデルでは、近年自然言語処理分野で着目されている「注意機構付きニューラルネットワーク」を用いた。注意機構により例えば、「人を褒める」という入力文の善悪性を判定する際に「褒める」に着目して出力値を決定するなどが可能になる。また、単純に従来モデルを利用するだけではなく、道徳性を推定するタスクにおいて有用であると考えられている「共起情報」をネットワークに導入した。これにより言語の表層的な情報だけではなく、共起情報も考慮して道徳性の推定が可能になった。 評価実験の結果、従来手法よりも高い精度で道徳性の推定が可能になった。また注意機構の導入により、定性的なモデルの分析が可能であることを示した。 この研究内容は日本感性工学会学術論文誌に投稿を行い、2018年1月16日に採録が決定している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題はおおむね順調に進展している。その理由は、予定していた研究内容の大部分が終了したためである。具体的には疑似ラベル付きデータを獲得し、それらのデータを基に機械学習モデルを構築することができた。また、提案モデルの精度が既存研究の精度よりも有意に優れていることを確認できた。これらの研究内容は学術論文誌に投稿しており、2018年1月に採録が決定した。これらのことを考え、研究はおおむね順調に進展していると考えられる。
|
今後の研究の推進方策 |
今後は道徳性の推定の高度化を目指す。具体的には以下の2点について考えている。 1点目はノイズの存在するデータの取り扱いである。本研究で獲得された訓練データの中にはノイズとなるような事例も存在する。具体的には、主観評価実験の結果、正しくラベル付けされたデータは5 割弱という結果が出ている。一般的に教師あり学習のモデル構築では、人手により正しくラベル付けされているデータを取り扱うため、本研究のようなノイズデータが存在することは前提とはされていない。このようなノイズデータが存在する状況下での機械学習については、近年様々な分野で盛んに研究が行われている。例えば,関係抽出の分野では本研究と同じようにノイズ付きのデータを訓練データとして用いるため、それをうまくモデル化する研究が行われている。自然言語処理分野に限らず、画像認識の分野でもこのようなノイズ付きデータを前提とした研究が存在する。上記で提案されているモデルは、本研究においても適用可能であり、適切にモデルを構築することで精度が向上すると考えられる。 2点目はNeutralな事例の取り扱いである。本研究では、1 文を入力としその文が表している行為が道徳的に善い行為なのか、もしくは悪い行為なのかを判断する2 値分類モデルの構築を行った。しかしながら、人の行動の中には、PositiveとNegative の2 つの軸で測れないものが存在する。この問題に対しては幾つかの現実的な手法が考えられる。例えば、最終的にシステムの出力値はアナログ値になるため、Neutral に割り当てる閾値を設定すれば良い。他には、人の行動を表すが、評価表現と共起しない事例を大量に集め、それらを擬似的にNeutral な事例として学習データに加える方法も考えられる。その際は、3 クラスの分類問題としてモデルの構築を行えば良いことになる。
|