研究課題/領域番号 |
21K12066
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 大阪工業大学 |
研究代表者 |
瀬尾 昌孝 大阪工業大学, ロボティクス&デザイン工学部, 准教授 (60725943)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | 深層学習 / 潜在空間 / 判断根拠理解 / disentanglement / 潜在変数空間 |
研究開始時の研究の概要 |
本研究では実応用を想定し、半教師あり学習を用いたdisentanglementな潜在変数空間の獲得手法を開発する。少数のラベルにより各変数に獲得させたい特徴を陽に指定することで上記の問題の解決を図る。課題解決に有用なラベルを事前に用意できない場合は、無用なラベルを半教師ありで学習させたうえでそれらを除去し、低次元化された潜在変数空間を用いた低計算コストでの課題解決も期待される。さらに本手法で獲得されるdisentanglementな潜在変数空間を利用した応用例として、多数の要因の影響を受けると想定される状況:繁華街における歩行者行動の異常検知の実現を目指す。
|
研究実績の概要 |
三年にわたる本研究課題の二年目として、主に(1)画像特徴の周波数成分に応じた潜在空間の獲得、(2)顔面神経麻痺の発症部位および程度に応じた潜在空間の獲得、(3)複数Encoderを用いた非冗長な潜在空間の獲得、の三件のテーマに主に取り組んで実験を行った。 各テーマとも、主に学習用データベースの構築と比較的シンプルなモデルでのシミュレーション実験が中心である。(1)では高解像度の顔画像データベースを段階的にダウンスケールしたデータベース20000セットを構築し、StyleGANを元にしたネットワークを用いて、解像度ごとに表現可能な特徴を個別の潜在空間にまとめる実験を行った。(2)では顔面神経麻痺患者および健常者、計43人の表情変化を収録した顔画像データベースを構築し、複数の目的別に作成したEncoderおよびDiscriminatorを用いることで個人の顔形状に起因する特徴と顔面神経麻痺の発症部位および程度に起因する特徴の切り分けを行った。(3)では、主にMNISTやCifer10などの公開データセットを使用して、多目的学習を多段的に実施することで複数のEncoderに非冗長な潜在空間を獲得させ、データの特性に応じた直感的な特徴マップの獲得を行った。いずれの研究においても現状ではそれぞれに課題を抱えているものの、従来法と比べて一定の成果を得た。 これらの実験および派生の研究テーマに関して、国内会議13件、国際会議6件、国際学会論文1件ですでに発表を実施した。また、査読を通過した未公開の国際学会論文が1件ある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度は前年度に構築した学習用データベースを用いた実験を進め、国内会議、国際会議を中心として第一次の成果発表を行った。国内会議13件、国際会議6件、国際会議論文1件を発表でき、概ね順調に研究を実施できていると考える。
|
今後の研究の推進方策 |
三年目である2023年度も引き続き、前述の三件のテーマについて実験を進め、発表および(2)についてはシミュレーションシステムの構築を進めていく予定である。それと共にこれまでに作成した手法およびシステムの精緻化、対外発表に重点を置く。(2)については研究協力者の病院での試験運用に向けて準備を進めていく予定である。
|