2020 年度実績報告書

人間の認知システムを基にしたマルチモーダルデータ検索エンジンの開発

研究課題

研究課題/領域番号	19H04172
研究機関	大阪学院大学
研究代表者	上原邦昭大阪学院大学, 経営学部, 教授 (60160206)
研究分担者	白浜公章近畿大学, 理工学部, 准教授 (30467675) 松原崇大阪大学, 基礎工学研究科, 准教授 (70756197)
研究期間 (年度)	2019-04-01 – 2023-03-31
キーワード	マルチモーダルデータ検索エンジン / 映像検索手法 / 深層学習
研究実績の概要	本研究は，マルチモーダルデータ検索エンジンと映像検索手法の開発からなる。まずデータ駆動型のマルチモーダルデータ検索エンジンは，ブラックボックス的に獲得された，埋め込みと呼ばれる符号の間で類似関係を学習することで実現されている．しかし，このアプローチは性能の大部分がデータ量に依存しており，意味の曖昧性や包含関係や複合概念を扱うことができない．本年度は，埋め込みに包含関係や記号理論的関係を組み合わせるため，構造を持った埋め込み空間を利用することを検討した．複数の構造をソフトに組み合わせる手法を提案し，人工知能学会より優秀発表賞に選ばれた．また動的に意味空間を切り替える手法を提案し，論文誌に掲載された．さらに広い意味で意味空間を考慮する研究を行い，画像分類において公平性の向上させるよう意味空間を設計する方法や，データ空間がもつ幾何学的構造を保存したまま変換する手法などを提案し，それぞれ国会会議等に採録された．人間の注意機構を考慮した映像検索手法に関しては，前年度開発した，映像のフレーム中の領域と検索クエリ中の単語を対応づける手法を，領域と名詞句も対応づけられるように拡張した．名詞句は，複数の単語からなる，より具体化された意味を表すため，人間の注意を特に引きやすいと考えられる．領域と名詞句の対応づけに加えて，分析するフレーム数と検索性能の関係の検証，フレームと検索クエリの全体的な対応関係に基づく手法の追加的な導入を行った結果，世界的な映像検索コンテストTRECVID Ad-hoc Video Search (AVS)部門で2019年度に開発された手法と比較して，最高精度を達成することに成功した．また，フレームという画像分析に関する知見をマイクロスコープからの画像に映る微生物の認識，映像という時系列データの分析に関する知見を生理学データに応用した論文が国際ジャーナルに収録された．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由データ駆動型のマルチモーダルデータ検索エンジンについては，本年度計画時に構想していた束論や一階述語論理との組み合わせについて検討したが，厳密な制約として課すと，データ駆動的な学習とコンフリクトすることがわかった．そのため，制約のソフトな組み合わせや意味空間の切り替えといった柔軟な方法の検討に方針を修正し，新たな研究課題とすることで，結果的に受賞や論文誌掲載につながった．そのため，得られた成果としては当初想定していたものに相当すると考え，進捗状況は順調であると考える．人間の注意機構を考慮した映像検索手法については，研究申請時，映像のフレーム中の領域と単語を対応づけて検索する手法しか提案しておらず，本年度行ったフレームと名詞句を対応づける拡張は、そのさらなる発展型であるため，進捗状況は想定以上である．ただし，フレーム中の領域と名詞句の対応づけには改善の余地を残している．具体的には，例えば「red dress」のように，構成する単語の意味が名詞句の意味に直接関係している検索クエリに関しては性能向上が見られたが，例えば「black man」のblackが黒い色を表していないというように，名詞句を構成すると意味が変わる単語を含んだ検索クエリの場合はうまく検索が行えないことが判明した．そのため，映像検索手法のさらなる改良が必要であることが分かった．
今後の研究の推進方策	データ駆動型のマルチモーダルデータ検索エンジンについては，計算機サーバ導入の遅延等により，大規模な実験がいまだ進んでいない．これまでに得られた成果を大規模化し，実験結果を国際会議や論文誌でまとめるととともに，当初予定していた確率的な埋め込みを洗練させて成果を得る予定である．人間の注意機構を考慮した映像検索手法については，現在の映像のフレーム中の領域と名詞句を対応づける手法の問題として，名詞句を表現する特徴を単に構成要素の単語の特徴の平均と画一的に扱っている点が考えられる．そのため，「black man」のblackのように，単体での特徴と名詞句中での特徴が変化する単語をうまく扱えていないと考えられる．そこで，検索クエリを構文解析して得られた句構造木に，再起型ニューラルネットワークを適用して，構成要素の単語の特徴から名詞句の特徴を動的に構成し，フレーム中の領域と名詞句を対応づける手法を開発する．加えて，名詞句だけでなく，動詞句とフレーム中の領域を対応づけて検索する手法や，学習データ中の名詞句の出現頻度の低さを補完するための言語コーパスの追加的な利用などを検討する．

研究成果
(19件)

すべて 2022 2021 2020

すべて雑誌論文 (6件) (うち国際共著 2件、査読あり 6件、オープンアクセス 3件) 学会発表 (13件) (うち国際学会 2件)

[雑誌論文] Deep Generative Model using Unregularized Score for Anomaly Detection with Heterogeneous Complexity2022
- 著者名/発表者名
  Takashi Matsubara, Kazuki Sato, Kenta Hama, Ryosuke Tachibana, and Kuniaki Uehara
- 雑誌名
  
  IEEE Transactions on Cybernetics
  
  巻: 52 ページ: -
- DOI
  10.1109/TCYB.2020.3027724
- 査読あり
[雑誌論文] Neural Architecture Search for Convolutional Neural Networks with Attention2021
- 著者名/発表者名
  Kohei Nakai, Takashi Matsubara, and Kuniaki Uehara
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E104.D ページ: 312-321
- DOI
  10.1587/transinf.2020EDP7111
- 査読あり / オープンアクセス
[雑誌論文] Target-Oriented Deformation of Visual-Semantic Embedding Space2021
- 著者名/発表者名
  Takashi Matsubara
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E104.D ページ: 24-33
- DOI
  10.1587/transinf.2020MUP0003
- 査読あり / オープンアクセス
[雑誌論文] LCU-Net: A novel low-cost U-Net for environmental microorganism image segmentation2021
- 著者名/発表者名
  Jinghua Zhang, Chen Li, Sergey Kosov, Marcin Grzegorzek, Kimiaki Shirahama, Tao Jiang, Changhao Sun, Zihan Li and Hong Li
- 雑誌名
  
  Pattern Recognition
  
  巻: 115 ページ: -
- DOI
  10.1016/j.patcog.2021.107885
- 査読あり / 国際共著
[雑誌論文] Deep State-Space Model for Noise Tolerant Skeleton-based Action Recognition2020
- 著者名/発表者名
  Kazuki Kawamura, Takashi Matsubara, and Kuniaki Uehara
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E103.D ページ: 1217-1225
- DOI
  10.1587/transinf.2019MVP0012
- 査読あり / オープンアクセス
[雑誌論文] Sleep stage classification for child patients using DeConvolutional Neural Network2020
- 著者名/発表者名
  Xinyu Huang, Kimiaki Shirahama, Frederic Li and Marcin Grzegorzek
- 雑誌名
  
  Journal of Artificial Intelligence in Medicine
  
  巻: 110 ページ: -
- DOI
  10.1016/j.artmed.2020.101981
- 査読あり / 国際共著
[学会発表] 幾何学的構造を考慮した深層学習による3次元点群生成2021
- 著者名/発表者名
  木村匠，松原崇，上原邦昭
- 学会等名
  Proc. of The 2021 Japanese Society for Artificial Intelligence (JSAI2021)
[学会発表] ペア入力を用いた敵対的学習による医用画像スタイル変換2021
- 著者名/発表者名
  藤岡和暉, 松原崇, 上原邦昭
- 学会等名
  電子情報通信学会医用画像研究会(MI2021)
[学会発表] 属性情報を分離したfMRI 画像の深層状態空間モデル2021
- 著者名/発表者名
  草野航希，松原崇，上原邦昭
- 学会等名
  電子情報通信学会医用画像研究会(MI2021)
[学会発表] トポロジーを考慮した3次元点群深層生成モデル2021
- 著者名/発表者名
  木村匠，松原崇，上原邦昭
- 学会等名
  情報処理学会コンピュータビジョンとイメージメディア研究会(CVIM2021)
[学会発表] Counterfactual Image Generation using GAN for Fairness2021
- 著者名/発表者名
  綿岡晃輝, 松原崇, 上原邦昭
- 学会等名
  情報処理学会コンピュータビジョンとイメージメディア研究会(CVIM2021)
[学会発表] クエリの句構造と物体領域の対応づけによる映像検索2021
- 著者名/発表者名
  宇津木駿介，白浜公章
- 学会等名
  2021年電子情報通信学会総合大会
[学会発表] Att-DARTS: Differentiable Neural Architecture Search for Attention2020
- 著者名/発表者名
  Kohei Nakai, Takashi Matsubara and Kuniaki Uehara
- 学会等名
  Proc. of The 2020 International Joint Conference on Neural Networks (IJCNN2020)
- 国際学会
[学会発表] Kindai University and Osaka Gakuin University at TRECVID 2020 AVS and ActEV Tasks2020
- 著者名/発表者名
  Daiki Mukai, Ryosuke Utsunomiya, Shunsuke Utsuki, Kimiaki Shirahama, Takashi Matsubara and Kuniaki Uehara
- 学会等名
  Proc. of TREC Video Retrieval Evaluation (TRECVID 2020)
- 国際学会
[学会発表] 集合データの共通特徴抽出を利用したFew-shot異常検知2020
- 著者名/発表者名
  佐藤一輝，中田智史，松原崇，上原邦昭
- 学会等名
  電子情報通信学会情報論的学習理論と機械学習研究会 (IBISML2020)
[学会発表] 画像データを対象とした異常検知の動向と今後の展望2020
- 著者名/発表者名
  佐藤一輝，松原崇，上原邦昭
- 学会等名
  電子情報通信学会複雑コミュニケーションサイエンス研究会
[学会発表] 公平性により生じる敵対的攻撃に対する脆弱性2020
- 著者名/発表者名
  綿岡晃輝, 松原崇, 上原邦昭
- 学会等名
  Proc. of The 2020 Japanese Society for Artificial Intelligence (JSAI2020)
[学会発表] 注意機構を持った深層ニューラルネットワークの勾配探索2020
- 著者名/発表者名
  中井康平, 松原崇, 上原邦昭
- 学会等名
  Proc. of The 2020 Japanese Society for Artificial Intelligence (JSAI2020)
[学会発表] 知識グラフ上の経路クエリの横断評価モデル2020
- 著者名/発表者名
  濱健太, 松原崇, 上原邦昭
- 学会等名
  Proc. of The 2020 Japanese Society for Artificial Intelligence (JSAI2020)

2020 年度 実績報告書

人間の認知システムを基にしたマルチモーダルデータ検索エンジンの開発

研究代表者

上原 邦昭 大阪学院大学, 経営学部, 教授 (60160206)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Deep Generative Model using Unregularized Score for Anomaly Detection with Heterogeneous Complexity2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Neural Architecture Search for Convolutional Neural Networks with Attention2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Target-Oriented Deformation of Visual-Semantic Embedding Space2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] LCU-Net: A novel low-cost U-Net for environmental microorganism image segmentation2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Deep State-Space Model for Noise Tolerant Skeleton-based Action Recognition2020

著者名/発表者名

雑誌名

DOI

[雑誌論文] Sleep stage classification for child patients using DeConvolutional Neural Network2020

著者名/発表者名

雑誌名

DOI

[学会発表] 幾何学的構造を考慮した深層学習による3次元点群生成2021

著者名/発表者名

学会等名

[学会発表] ペア入力を用いた敵対的学習による医用画像スタイル変換2021

著者名/発表者名

学会等名

[学会発表] 属性情報を分離したfMRI 画像の深層状態空間モデル2021

著者名/発表者名

学会等名

[学会発表] トポロジーを考慮した3次元点群深層生成モデル2021

著者名/発表者名

学会等名

[学会発表] Counterfactual Image Generation using GAN for Fairness2021

著者名/発表者名

学会等名

[学会発表] クエリの句構造と物体領域の対応づけによる映像検索2021

著者名/発表者名

学会等名

[学会発表] Att-DARTS: Differentiable Neural Architecture Search for Attention2020

著者名/発表者名

学会等名

[学会発表] Kindai University and Osaka Gakuin University at TRECVID 2020 AVS and ActEV Tasks2020

著者名/発表者名

学会等名

[学会発表] 集合データの共通特徴抽出を利用したFew-shot異常検知2020

著者名/発表者名

学会等名

[学会発表] 画像データを対象とした異常検知の動向と今後の展望2020

著者名/発表者名

学会等名

[学会発表] 公平性により生じる敵対的攻撃に対する脆弱性2020

著者名/発表者名

学会等名

[学会発表] 注意機構を持った深層ニューラルネットワークの勾配探索2020

著者名/発表者名

学会等名

[学会発表] 知識グラフ上の経路クエリの横断評価モデル2020

著者名/発表者名

学会等名

2020 年度実績報告書

上原邦昭大阪学院大学, 経営学部, 教授 (60160206)