研究課題/領域番号 |
16K16024
|
研究機関 | 大阪大学 |
研究代表者 |
寺田 吉壱 大阪大学, 基礎工学研究科, 助教 (10738793)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | Normalized cut / Spectral clustering / 関数データ解析 / 半教師付き学習 |
研究実績の概要 |
本年度は,研究 (A)「多変量データに対するnormalized cutを用いたクラスタリング法の理論的性質の解明」および 研究 (B)「関数データに対する半教師付き学習の理論と応用」の2つの研究を中心に行った.
(A) 近年,グラフ(ネットワーク)分割を多変量データのクラスタリングに応用したspectral clustering (SC) がクラスタリング法の主流となっている.SCはnormalized cut (Ncut)とよばれるグラフ分割法をベースとしている.しかし,normalized cutはNP困難な問題であるため,SCはNcutを緩和した方法となっている.一方で,Dhillon et al. (2007) によってNcutの局所解を効率的に得るアルゴリズムが提案された.本年度の研究では,Ncutによる多変量データのクラスタリングが漸近的にあるRKHS上の重み付きk-means法の解に収束することを示した.さらに,このRKHS上の重み付きk-meansが背後のデータ分布に対するNcutに対応していることを証明した.これにより,Ncutの近似として用いられるSCはNcutとは本質的に異なる方法であること,Ncutによって得られたクラスタリング結果にはSCと異なり明確な最適性があることが明らかとなった.
(B) 本研究では,片方のクラスのデータの一部にしかラベルが得られていない状況を想定した関数データに対する半教師付き2値判別問題に関する提案手法のより詳細な理論を構築した.そして,大阪大学医学系研究科小笠原一生先生との共同研究を行い,床反力データから膝に関わる特定の怪我(ACL損傷)の危険性があるスポーツ選手を特定する問題に提案手法を適用することで,実際に怪我の危険性のある選手の特定に成功した.この内容は,NHKニュース「おはよう日本」の番組内で紹介された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度は,研究内容自体の進捗は計画以上の成果が得られたが, 所属の変更等の影響で論文執筆・投稿が遅れている.
関数データ解析に関する研究では,提案手法の理論的研究のみでなく実データへの応用に関する研究を行うことができた.また,ネットワークデータ解析に関する研究では,ネットワーク分割を多変量解析に応用した場合の理論解析など新しい研究を行い,理論的結果を得ることができた.さらに,本年度から,新たに,クラスタリング結果に信頼度を与える方法に関する研究に着手している.これらのことから,予定していた研究内容とは異なる部分もあるが,研究内容自体の進捗は計画以上の成果が得られたと評価できる.一方で,これまでの研究成果をまとめる作業に遅れがあるため,総合的には「やや遅れている」と評価した.
|
今後の研究の推進方策 |
今後の研究方針としては,先ず本年度に得られた結果の論文化に重点をおいて推進していく予定である.そして,関数データ解析に関する研究においては,スペクトルデータや運動に関わるデータなど様々な実データへの応用研究を各応用分野の研究者と進める. また,クラスタリング結果に信頼度を与える方法の研究に関して,これまでに基本的な理論結果は得られているため,数値実験や実データ解析などを通して提案手法の有用性について詳細に研究を進めていきたい.
|
次年度使用額が生じた理由 |
論文投稿のため,2本の英文校閲費用の研究費を残していたが,論文執筆の進捗が遅れたため,研究打ち合わせ用の携帯可能なノートPCの購入に変更し,未使用額が生じた.
|
次年度使用額の使用計画 |
次年度には,この未使用額を予定通り英文校閲費用にあてる予定である.
|