研究課題/領域番号 |
17K00295
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 北海道大学 |
研究代表者 |
RZEPKA Rafal 北海道大学, 情報科学研究院, 助教 (80396316)
|
研究期間 (年度) |
2017-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 知識獲得 / 因果関係 / コモンセンス / 文脈処理 / ストーリー処理 / corpus creation / story generation / danger detection / commonsense / common sense / causal relations / story understanding / crowdsourcing / context understanding / knowledge completion / natural language / language models / context processing / implicit knowledge / semantic chains / text generation / data collection / data analysis / knowledge testing / 人工知能 |
研究成果の概要 |
本研究は、機械学習に用いるデータを、現在一般的に用いられているコーパスにおける単なる単語の統計ではなく、人間の教師に相当するものとして作成することを目的としたものである。現在の知識グラフは事象の因果関係を推論するのにはあまり役に立たないため、事象を自動的に補完する手法を提案し、危険検出のタスクで文脈の小さな変化が結果をどのように変更するかを検証した。が、自動的なアプローチは不自然な補完に悩まされ、日本語の評価セットが存在しなかった。そこで、文脈変化の影響を認識するための21,592文と、ストーリー理解実験のための8,800の5文のストーリーという2つのデータセットを作成した。
|
研究成果の学術的意義や社会的意義 |
本研究の成果のアルゴリズムは、言語モデルの出力を知識ベースとコーパステキストを用いることによって部分的に制御することができることを示した。このアプローチは現在でも広く利用されておらず、制御されない深層学習が危険な判断をする原因になることがあり、社会が人工知能の研究を信用しない原因の一つでもある。本研究で作成したデータセットは、危険検知における文脈変化の影響に関するものとしては世界初で,大量なストーリーのDBとして日本語で初めて作成されたものである。両方のデータセットの公開は、人工知能が日常生活での行動が安全かどうかを検証するための新しいタスクを切り開く可能性がある。
|