2016 Fiscal Year Annual Research Report
内在的構造を持つ大規模高次元データ解析の理論と方法
Project/Area Number |
26280009
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
福水 健次 統計数理研究所, 大学共同利用機関等の部局等, 教授 (60311362)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 大慈 東京工業大学, その他部局等, 准教授 (60551372)
小林 景 慶應義塾大学, 理工学部, 准教授 (90465922)
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Keywords | 統計数学 / データ解析 / 高次元 / アルゴリズム |
Outline of Annual Research Achievements |
本年度の主たる実績の一つとして,系統樹を表現するツリーデータ全体の空間の性質を利用したデータ解析手法に関して研究を行った.その結果,Billera-Holmes-Vogtmann によるツリーデータのなす距離空間の性質を利用したクラスタリング手法を確立し,系統樹解析に応用した.具体的には,遺伝子ごとに作成された多くの系統樹データをBillera-Holmes-Vogtmann 距離行列に基づいてクラスタリングし,遺伝子クラスタごとに異なる進化系統樹が構築される場合があることを確認し,実データに応用した.この結果を論文としてまとめ英文論文誌Annals of Operations Researchに発表した. また,別の実績として,距離行列がツリー構造から決まるかどうかの条件に関して数理的な研究を行い,新しい数学的な定式化を見出した.この結果をまとめ英文論文誌IEEE/ACM Transactions on Computational Biology and Bioinformaticsに発表した. さらに,高次元データのハブ構造に関して継続して研究を進めた.特に,クラスタごとにハブを解消する方法に関して基礎的検討と数値実験による評価を行った. 新しい方向性の探索として,カーネル関数の近似手法であるランダムフーリエ特徴に関して研究のサーベイと考察を行い,解釈性の高くかつ効率的計算に関して基礎的な検討を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
課題1の,「内在的構造を持つ大規模高次元データの数理」に関しては,ハブ構造やツリー構造などの内在的構造を持つデータの数理と解析手法に関して研究が進んでおり,成果をまとめた論文も発表されており,研究は順調に進んでいる.課題2の「高次元データに対するカーネル法の理論と方法」は,問題の定式化に難しさがあり,方向性の見直しが必要である.課題3の「超効率的アルゴリズムの理論と応用」については,カーネル法による積分近似などの効率的アルゴリズムの研究に注力する予定である.
|
Strategy for Future Research Activity |
課題2の「高次元データに対するカーネル法の理論と方法」に関しては,研究の方向性の見直しの必要性が明らかになってきたため,検討を進めた結果,今後重要性が増すと考えられる,ランダムフーリエ特徴などの理論と方法に関して研究を展開していく予定である.
|
Causes of Carryover |
当初予定していた人件費に関して,機関の運営費交付金を充当することができたために見込みよりも支出が少なくなった.
|
Expenditure Plan for Carryover Budget |
余剰の金額については,次年度,海外の共同研究者を招へいする際の旅費に充当する計画である.
|
Research Products
(4 results)