2016 Fiscal Year Annual Research Report
Theories and Methodologies for Large Complex Data
Project/Area Number |
15H01678
|
Research Institution | University of Tsukuba |
Principal Investigator |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
Co-Investigator(Kenkyū-buntansha) |
星野 伸明 金沢大学, 経済学経営学系, 教授 (00313627)
金森 敬文 名古屋大学, 情報科学研究科, 教授 (60334546)
植木 優夫 久留米大学, 付置研究所, 准教授 (10515860)
矢田 和善 筑波大学, 数理物質系, 准教授 (90585803)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | 高次元データ / データサイエンス / 統計数学 / ゲノム / マイクロアレイ |
Outline of Annual Research Achievements |
本研究は、大規模複雑データの統計数理を、理論と方法論から総合的に研究するものである。モデルの構築と評価を担うモデリング技法の開発を目的とし、2年目に当たる平成28年度は、次の3つを研究テーマとした。 (1) 高次元における最適性理論と精度保証付きモデリング (2) 高次元における非線形構造と従属構造の統計数理 (3) 大規模複雑データの非正則推定論と相補的モデリング (1)について、青嶋と矢田は、高次元特有のデータ構造の膨張という問題を解決するために、推測の最適性をもった識別関数のクラスに高次元データを変換する方法を考え、小標本でも高精度を保証する精度保証付きモデリングを構築した。植木は、ゲノムデータにおける連鎖不平衡に起因する相関構造の予測についてアルゴリズムを構築し、さらに、隠れた遺伝要因を双方向グラフによって検出する統計手法を開発した。(2)について、青嶋と矢田は、高次元非線形主成分分析を考えた。線形変換では十分に除去できない複雑な高次元非線形ノイズを、多様体上であぶり出して除去するといった方法を考え、新規に非線形ノイズ掃き出し法を導いた。(3)について、金森は、離散ビッグデータに対する統計的手法を開発して統計的性質を理論的に解析し、さらに、これまで深く考察されてこなかった離散データに対するロバスト推定に応用した。星野は、コルチンモデル確率分割族について、周辺分布を求める方法を開発し、また、疎な分割表モデルを用いて匿名データを作成する理論を構築した。上記の研究テーマに沿って、論文発表と学会発表を行い、関連するシンポジウムを久留米シティプラザ・筑波大学・金沢大学・名古屋大学で計4回開催した。大規模複雑データを扱う様々な分野の研究者から高い関心を集め、研究成果や問題提起について活発な意見交換がなされた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画の2年目として、研究目的を達成するための準備が、ほぼ計画通りに完成しつつある。特に研究テーマ(2)は、当初の計画以上の成果が見えつつある。
|
Strategy for Future Research Activity |
研究計画の3年目に当たる次年度は、大規模複雑データの非正則推定論と相補的モデリングについて、データ変換法を重点的に研究する。
|
Research Products
(30 results)