研究課題/領域番号 |
20K11958
|
研究機関 | 大阪府立大学 |
研究代表者 |
岡田 真 大阪府立大学, 工学(系)研究科(研究院), 助教 (40336813)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 文意一貫性 / 文書生成 / 深層学習 |
研究実績の概要 |
2020 年度の本申請に関連する実績としては学術論文発表 1 件,国際会議発表 1 件,学術講演発表 3 件であった. 本申請では文意一貫性と意外性をともに兼ね備えた独創的な文を人間と協調して生成する人工知能の開発を目標としている.2020 年度では文意一貫性の理解を目標に,文意の理解,複数文の文意一貫性の理解,それらの文生成への応用について取り組んだ.まず画像と言語のマルチモーダルメディアである漫画を対象としてそれらのセリフの感情推定を研究した.これは直接文意一貫性の理解とは関係がないように思われるが,漫画のセリフのほとんどは口語対話文であり,文間の相互意味関係をとらえるためには文意の理解は必須である.セリフに含まれる感情を人工知能が理解できれば,人工知能の文意一貫性の理解力の向上に効果的であると予想される.漫画のセリフと画像をそれぞれ深層言語モデルに入力して相補的に感情推定の精度を向上する手法について取り組み,一定の成果を得た.またセリフに含まれる単語の類義語を日本語 Wordnet により拡張し,それにより精度向上を図った. また文意一貫性の理解の可能性を探るために,小説の段落境界の推定に取り組んだ.小説の段落は筆者が文書の内容を基にまとめたものと考えられる.この段落の境界位置を正しく推定することは人工知能が文書中の意味的つながりをある程度理解していないと難しい.申請者はこちらをある種の不均衡な分類問題としてとらえて深層学習の不均衡データの分類に効果があるといわれている Dice 損失や Focal 損失を利用することで分類が可能であると示した.これにより人工知能が文間の意味一貫性をとらえる能力を持ちうると示すことができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本申請の目標は文意一貫性と意外性をともに兼ね備えた独創的な文を人間と強調して生成する人工知能の開発であり,2020 年度はその中の文意一貫性に関する問題に主に取り組んだ.そこで文意一貫性については深層学習の手法を適切に適用することである程度までは適切に推定することが可能であると確認できた.これは後々文生成に取り組む際に文意一貫性を保った文生成や生成された文間の関係を適切に推定可能であることを示している.この点において研究の進捗は順調であるといえる.
|
今後の研究の推進方策 |
現在文意一貫性の推定がある程度までは適切に可能であることを確認している段階である.2021 年度と 2022 年度においては (1) 文生成にそちらを適用した際に生成された文が文意一貫性を保ったまま生成できてるか判定する手法,(2) 人間と協調した文生成手法,(3) 文意一貫性を保ったうえで意外性のある文生成手法について考案していく予定である.
|
次年度使用額が生じた理由 |
コロナウィルスの蔓延により,国際会議などへの参加が不可能となったため,旅費等で使用することができなくなったことによる.次年度および最終年度において国内および国際会議での旅費などに使用する予定である.
|