Acquisition of understandable latent variable space in deep learning
Project/Area Number |
21K12066
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61040:Soft computing-related
|
Research Institution | Osaka Institute of Technology |
Principal Investigator |
瀬尾 昌孝 大阪工業大学, ロボティクス&デザイン工学部, 准教授 (60725943)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
|
Keywords | 深層学習 / 潜在空間 / 判断根拠理解 / disentanglement / 潜在変数空間 |
Outline of Research at the Start |
本研究では実応用を想定し、半教師あり学習を用いたdisentanglementな潜在変数空間の獲得手法を開発する。少数のラベルにより各変数に獲得させたい特徴を陽に指定することで上記の問題の解決を図る。課題解決に有用なラベルを事前に用意できない場合は、無用なラベルを半教師ありで学習させたうえでそれらを除去し、低次元化された潜在変数空間を用いた低計算コストでの課題解決も期待される。さらに本手法で獲得されるdisentanglementな潜在変数空間を利用した応用例として、多数の要因の影響を受けると想定される状況:繁華街における歩行者行動の異常検知の実現を目指す。
|
Outline of Annual Research Achievements |
三年にわたる本研究課題の二年目として、主に(1)画像特徴の周波数成分に応じた潜在空間の獲得、(2)顔面神経麻痺の発症部位および程度に応じた潜在空間の獲得、(3)複数Encoderを用いた非冗長な潜在空間の獲得、の三件のテーマに主に取り組んで実験を行った。 各テーマとも、主に学習用データベースの構築と比較的シンプルなモデルでのシミュレーション実験が中心である。(1)では高解像度の顔画像データベースを段階的にダウンスケールしたデータベース20000セットを構築し、StyleGANを元にしたネットワークを用いて、解像度ごとに表現可能な特徴を個別の潜在空間にまとめる実験を行った。(2)では顔面神経麻痺患者および健常者、計43人の表情変化を収録した顔画像データベースを構築し、複数の目的別に作成したEncoderおよびDiscriminatorを用いることで個人の顔形状に起因する特徴と顔面神経麻痺の発症部位および程度に起因する特徴の切り分けを行った。(3)では、主にMNISTやCifer10などの公開データセットを使用して、多目的学習を多段的に実施することで複数のEncoderに非冗長な潜在空間を獲得させ、データの特性に応じた直感的な特徴マップの獲得を行った。いずれの研究においても現状ではそれぞれに課題を抱えているものの、従来法と比べて一定の成果を得た。 これらの実験および派生の研究テーマに関して、国内会議13件、国際会議6件、国際学会論文1件ですでに発表を実施した。また、査読を通過した未公開の国際学会論文が1件ある。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度は前年度に構築した学習用データベースを用いた実験を進め、国内会議、国際会議を中心として第一次の成果発表を行った。国内会議13件、国際会議6件、国際会議論文1件を発表でき、概ね順調に研究を実施できていると考える。
|
Strategy for Future Research Activity |
三年目である2023年度も引き続き、前述の三件のテーマについて実験を進め、発表および(2)についてはシミュレーションシステムの構築を進めていく予定である。それと共にこれまでに作成した手法およびシステムの精緻化、対外発表に重点を置く。(2)については研究協力者の病院での試験運用に向けて準備を進めていく予定である。
|
Report
(2 results)
Research Products
(31 results)