• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

技術者の認知・判断・行動プロセスに基づくハイパーマルチモーダル画像分類技術の構築

Research Project

Project/Area Number 20K19856
Research InstitutionHokkaido University

Principal Investigator

前田 圭介  北海道大学, 総合IR室, 特任助教 (20798243)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywords画像分類 / 生体情報 / 機械学習 / 解釈性 / 暗黙知 / 深層学習 / 信号処理 / マルチモーダル
Outline of Annual Research Achievements

AI技術の応用が期待される専門分野において,高い精度のみならず結果に対する確かな信頼性を有するモデルを構築することが本研究の目的である.このモデルの構築のためには,次の4点を組み込んだ機械学習理論の構築が必要である.【要点1】経験や知識の基となる情報を機械に入力可能な特徴へ変換するモデル.【要点2】経験や知識を表す生体特徴を抽出することで技術者に近い判断が可能なモデル.【要点3】画像分類で判断する際の判断根拠を技術者が理解可能な形で提示するモデル.【要点4】得られた結果が誤っていた場合に,効率よく再学習可能なモデル.そこで,本研究では,【解決策1】複数の技術者から得られる種々の生体情報からノイズ・個人差を除去.【解決策2】複数の技術者に共通する特徴を見いだし,技術者の判断との間の因果関係を説明.【解決策3】判断・予想結果に対する判断根拠の可視化機構を導入.【解決策4】技術者からのフィードバック結果を用いたモデルパラメータの転移学習の4つの解決策により,上記要点を満たした新たな機械学習理論を導出する.
令和3年度では,【解決策2,3】に対応する【フェーズ2】生体特徴・専門画像・技術者の判断から因果推論可能なモデルの構築,【フェーズ3】構築したモデルの判断根拠の可視化に関する研究を実施した.具体的に,【フェーズ1】で取得した複数の技術者の生体特徴とその技術者が熟練であるか否かを表す情報を用い,技術者が共通に有する特徴を算出可能なモデルを構築した.さらに,モデルが予測するクラスの自信の度合いが大きい部分を推定可能な勾配計算理論を確立し,判断根拠を可視化する深層学習モデルを構築した.上記研究で得られた結果と関連成果を信号・画像処理系の国内会議・国際会議において発表した.さらに,学会発表で得られた知見に基づき,手法を高度化することにより,学術論文誌にも採録されている.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

実施計画では,令和3年度~令和5年度に【フェーズ2~4】を実施することが目標であった.その中で,令和3年度に【フェーズ2,3】に関する研究を遂行し,「研究実績の概要」で記述した通り,得られた成果の学会発表に加えて,それらを高度化することにより,学術論文誌にも採録されている.このことから,当初の計画以上に進展していると言える.さらに,【フェーズ4】では,構築したAI技術を現場の技術者に利用してもらう必要があるが,こちらに関して,実験に協力頂いているインフラ維持管理企業と連携し,活用に向けた準備を進めている.したがって,研究開始2年で【フェーズ4】にまで着手し,研究のさらなる発展が期待されることから,「(1)当初の計画以上に進展している.」と判断した.

Strategy for Future Research Activity

令和4年度以降の研究では,「研究実績の概要」に記載した【フェーズ2,3】の高度化を実施する.【フェーズ2】生体特徴・専門画像・技術者の判断から因果推論可能なモデルの高度化,および【フェーズ3】構築したモデルの判断根拠の可視化に関する技術の高度化を実施する.これらは,令和3年度で構築したモデルを基に,分類精度向上の観点から高度化を試みる.さらに,【解決策4】に該当する【フェーズ4】技術者からのフィードバックを再学習可能な転移学習モデルの構築に向けた研究を実施する.具体的に,また,【フェーズ4】では,【フェーズ3】までに構築したAI技術を現場の技術者に利用してもらい,AIの出力結果および判断根拠に対するフィードバックをもらう.それらを新たな学習データとし,モデルパラメータの転移学習を行うことで,再学習を実現し,実運用に耐え得る持続的な利用を可能とする.以上の研究計画にのっとり,本研究を遂行する.

Causes of Carryover

本研究では,多様な生体データを導入した深層学習に基づく画像分類技術を実現することから,データ取得および構築する技術の性能評価のためのPC等が必要であった.本年度の研究において,研究開始当初に予定していたデータ取得実験に加えて,別のインフラ維持管理企業とのデータ取得実験を検討することとなり,これらの多様なデータに対応可能な,より性能の高い機器を検討することとした.したがって,次年度使用とし,本年度の研究については,自主財源で既に保持している機器の利用を行った.
また,新型コロナウィルス感染症の影響による出張の延期等が生じたため,成果発表の時期を移動し,旅費等を次年度使用とする予定である.

  • Research Products

    (46 results)

All 2022 2021 Other

All Journal Article (7 results) (of which Peer Reviewed: 7 results,  Open Access: 7 results) Presentation (38 results) (of which Int'l Joint Research: 20 results) Remarks (1 results)

  • [Journal Article] Deterioration Level Estimation Based on Convolutional Neural Network Using Confidence-Aware Attention Mechanism for Infrastructure Inspection2022

    • Author(s)
      Ogawa Naoki、Maeda Keisuke、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      Sensors

      Volume: 22 Pages: 382~382

    • DOI

      10.3390/s22010382

    • Peer Reviewed / Open Access
  • [Journal Article] Time-Lag Aware Latent Variable Model for Prediction of Important Scenes Using Baseball Videos and Tweets2022

    • Author(s)
      Hirasawa Kaito、Maeda Keisuke、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      Sensors

      Volume: 22 Pages: 2465~2465

    • DOI

      10.3390/s22072465

    • Peer Reviewed / Open Access
  • [Journal Article] Refining Graph Representation for Cross-Domain Recommendation Based on Edge Pruning in Latent Space2022

    • Author(s)
      Hirakawa Taisei、Maeda Keisuke、Ogawa Takahiro、Asamizu Satoshi、Haseyama Miki
    • Journal Title

      IEEE Access

      Volume: 10 Pages: 12503~12509

    • DOI

      10.1109/ACCESS.2022.3142187

    • Peer Reviewed / Open Access
  • [Journal Article] Reliable Estimation of Deterioration Levels via Late Fusion Using Multi-View Distress Images for Practical Inspection2021

    • Author(s)
      Maeda Keisuke、Ogawa Naoki、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      Journal of Imaging

      Volume: 7 Pages: 273~273

    • DOI

      10.3390/jimaging7120273

    • Peer Reviewed / Open Access
  • [Journal Article] Feature Integration Through Semi-Supervised Multimodal Gaussian Process Latent Variable Model With Pseudo-Labels for Interest Level Estimation2021

    • Author(s)
      Kamikawa Kyohei、Maeda Keisuke、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      IEEE Access

      Volume: 9 Pages: 163843~163850

    • DOI

      10.1109/ACCESS.2021.3131979

    • Peer Reviewed / Open Access
  • [Journal Article] Detection of Important Scenes in Baseball Videos via Bidirectional Time Lag Aware Deep Multiset Canonical Correlation Analysis2021

    • Author(s)
      Hirasawa Kaito、Maeda Keisuke、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      IEEE Access

      Volume: 9 Pages: 84971~84981

    • DOI

      10.1109/ACCESS.2021.3088284

    • Peer Reviewed / Open Access
  • [Journal Article] Distress Image Retrieval for Infrastructure Maintenance via Self-Trained Deep Metric Learning Using Experts’ Knowledge2021

    • Author(s)
      Ogawa Naoki、Maeda Keisuke、Ogawa Takahiro、Haseyama Miki
    • Journal Title

      IEEE Access

      Volume: 9 Pages: 65234~65245

    • DOI

      10.1109/ACCESS.2021.3074019

    • Peer Reviewed / Open Access
  • [Presentation] 高速道路の遮音壁画像を用いた物体検出手法による変状分類の高精度化に関する検討2022

    • Author(s)
      梁, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 地下鉄トンネルの維持管理支援のためのマルチスケール解析を導入した深層学習に基づく変状検出に関する検討2022

    • Author(s)
      高田 紗弥, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 地下鉄トンネル点検時の技術者から取得される生体信号と技術者の点検行動の関連性分析2022

    • Author(s)
      平澤 魁人, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 画像注視時の脳活動信号を用いた圧縮再構成ネットワークに基づく視覚認知内容の推定に関する検討2022

    • Author(s)
      東 孝明, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] Attention map に対する確信度を考慮可能な深層学習を用いた変状分類の高精度化に関する検討2022

    • Author(s)
      小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 画像中の物体情報を考慮したユーザ類似度に基づく個人に特化した注視領域の推定に関する検討2022

    • Author(s)
      諸戸 祐哉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] ユーザの動作情報を用いたコンテンツの関心度推定に関する検討 -複数ユーザを導入した特徴統合の有効性検証-2022

    • Author(s)
      上川 恭平, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 道路構造物の維持管理効率化に向けた変状画像分類の高精度化に関する検討 -テキストデータに基づく類似事例の含有率の導入-2022

    • Author(s)
      平川 泰成, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] ゴム材料開発のための generative adversarial network に基づく配合量および物性からの電子顕微鏡画像の生成に関する一検討2022

    • Author(s)
      柳 凜太郎, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 知識蒸留を用いたfew-shot learningに基づく画像の感情ラベル推定に関する検討2022

    • Author(s)
      叶 穎睿, 諸戸 祐哉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] A note on realizing adversarial defense based on regularization of multi-stage squeeze-and-excitation features2022

    • Author(s)
      Jiahuan Zhang, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      ITE Technical Report
  • [Presentation] Captioning 特徴を利用したグラフ畳み込みネットワークに基づくアニメイラストのマルチラベル画像分類に関する検討2022

    • Author(s)
      蘭 子文, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] 橋梁点検時の技術者の一人称および三人称視点映像を用いた点検動作の分類に関する検討2022

    • Author(s)
      増田 毅, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
    • Organizer
      映像情報メディア学会技術報告
  • [Presentation] Text-guided image manipulation for desired region using referring image segmentation2021

    • Author(s)
      Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Defense against image captioning attacks via a robust and stable recurrent neural network2021

    • Author(s)
      Jiahuan Zhang, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Multi-Label image recognition based on multi-modal graph convolutional networks using captioning features2021

    • Author(s)
      Ziwen Lan, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Graph analysis-based recommendation via entity embeddings using wikipedia2021

    • Author(s)
      Nozomu Onodera, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Visual sentiment prediction using few-shot learning via distribution relations of visual features2021

    • Author(s)
      Yingrui Ye, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Analysis of social trends related to COVID-19 pandemic utilizing social media data2021

    • Author(s)
      Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Movie rating estimation based on weakly supervised multi-modal latent variable model2021

    • Author(s)
      Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] A trial of fine-grained classification of expert-novice level using bio-signals while inspecting subway tunnels2021

    • Author(s)
      Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] Few-shot personalized saliency prediction using person similarity based on collaborative multi-output Gaussian process regression2021

    • Author(s)
      Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Correlation-aware attention branch network using multi-modal data for deterioration level estimation of infrastructures2021

    • Author(s)
      Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Time-lag aware multi-modal variational autoencoder using baseball videos and tweets for prediction of important scenes2021

    • Author(s)
      Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Interest level estimation via multi-modal Gaussian process latent variable factorization2021

    • Author(s)
      Kyohei Kamikawa, Maeda Keisuke, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Cross-domain recommendation method based on multi-layer graph analysis with visual information2021

    • Author(s)
      Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    • Organizer
      IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Deep metric network via heterogeneous semantics for image sentiment analysis2021

    • Author(s)
      Yun Liang, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Image Processing
    • Int'l Joint Research
  • [Presentation] Degradation level estimation of road structures via attention branch network with text data2021

    • Author(s)
      Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Consumer Electronics-Taiwan
    • Int'l Joint Research
  • [Presentation] Estimation of visual features of viewed image from individual and shared brain information based on fMRI data using probabilistic generative model2021

    • Author(s)
      Takaaki Higashi, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing
    • Int'l Joint Research
  • [Presentation] Classification of expert-novice level using eye tracking and motion data via conditional multimodal variational autoencoder2021

    • Author(s)
      Yusuke Akamatsu, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing
    • Int'l Joint Research
  • [Presentation] Multi-modal label dequantized gaussian process latent variable model for ordinal label estimation2021

    • Author(s)
      Masanao Matsumoto, Keisuke Maeda, Naoki Saito, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing
    • Int'l Joint Research
  • [Presentation] Cross-domain semi-supervised deep metric learning for image sentiment analysis2021

    • Author(s)
      Yun Liang, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing
    • Int'l Joint Research
  • [Presentation] Feature integration via semi-supervised ordinally multi-modal Gaussian process latent variable model2021

    • Author(s)
      Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing
    • Int'l Joint Research
  • [Presentation] Shilling attackの状況下における グラフ解析に基づく推薦システムの脆弱性の検証2021

    • Author(s)
      小野寺 望, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      令和3年度 電気・情報関係学会北海道支部連合大会
  • [Presentation] Few-shot learningを用いた感情ラベル推定における複数のデータセット利用に関する初期検討2021

    • Author(s)
      叶 穎睿, 諸戸 祐哉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      令和3年度 電気・情報関係学会北海道支部連合大会
  • [Presentation] 自己教師あり学習を導入した潜在変数モデルによる低次元特徴の抽出に関する検討2021

    • Author(s)
      渡部 航史, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      令和3年度 電気・情報関係学会北海道支部連合大会
  • [Presentation] グラフ畳み込みネットワークに基づくアニメイラストのマルチラベル画像認識に関する検討2021

    • Author(s)
      蘭 子文, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      令和3年度 電気・情報関係学会北海道支部連合大会
  • [Presentation] テキスト入力型画像操作における操作領域に着目した精度評価に関する検討2021

    • Author(s)
      渡邉 優宇人, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
    • Organizer
      令和3年度 電気・情報関係学会北海道支部連合大会
  • [Remarks] 北海道大学大学院情報科学研究院メディアダイナミクス研究室 研究室メンバー

    • URL

      https://www-lmd.ist.hokudai.ac.jp/member/keisuke-maeda/

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi