研究実績の概要 |
2022年度は研究の最終年度として,人工知能による創作物理解に関して取りまとめた.個別研究としては,CLIP を用いた画像と言語データに基づく漫画の理解,だまし絵のような自然界には存在しない人の創作に基づいている画像の認識および自然界における星座画像の生成について検討した. AutoML に関しては gaCNN や evoCNN といった既存の手法に優越する tdgaCNN の提案および本課題で提案中である TDGA AA における探索アルゴリズム に Pareto TDGA を導入し,拡張方策の探索を多目的離散最適化問題として扱う Pareto TDGA AutoAugment (Pareto TDGA AA) を新たに提案した.研究成果は国内外での学会発表を通じて公表し,多くの研究者との意見交換や受賞などによって研究の有効性を確認した. 課題全体として,漫画に基づく研究(コマ識別,感情推定,オノマトペ理解),写真に基づく研究(写真の定量評価,星空画像の生成,昆虫画像の識別),だまし絵に関する研究(AI によるだまし絵の識別,画像情報に基づくだまし絵の生成,言語情報に基づくだまし絵の生成),その他の創作物理解(習字,ファッション,ゲーム)および AutoML に関する研究 (TDGA AA, Pareto TDGA AA, tdgaCNN) に関して多くの成果を得た. 一方で,ストーリー理解に関する研究については最終年度途中で発表された ChatGPT など最新の Transformer に基づく生成手法について部分的にではあるが研究を実施し,将来につながる有益な結果を得た.生成系人工知能の爆発的な発展によって,創作物理解および創作物生成の研究は今後ますます注目され,積極的に研究がなされていくはずである.本研究課題によって当該分野へ一定の貢献をすることができたと考える.
|