2019 Fiscal Year Research-status Report
高次元データの理解のための最適なスケーリングと可視化技法
Project/Area Number |
17K00044
|
Research Institution | The University of Tokyo |
Principal Investigator |
清 智也 東京大学, 大学院情報理工学系研究科, 准教授 (20401242)
|
Co-Investigator(Kenkyū-buntansha) |
田中 潮 大阪府立大学, 理学(系)研究科(研究院), 助教 (60516897)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 確率分布のスケーリング / 多変量データ / コピュラ / 可視化 / Textile plot / Textile set / コンパクト可微分多様体 / 2次形式の標準形 |
Outline of Annual Research Achievements |
研究代表者の清が中心となって、引き続き多次元確率分布のスケーリング問題に取り組んだ。関連する主な成果は以下の2つである。1つ目は、コピュラモデルの代替となる指数型分布族の基本的な性質の証明である。コピュラは多次元データの従属性を記述するのに有効な手法として広く利用されているが、統計的推論のうえで重要な条件付き独立性の記述には必ずしも向いていない。本研究では、単位立方体上の一様密度を中心とする自然な指数型分布族を考えたとき、大域的にはコピュラと一対一に対応しないという結果を示した。これは否定的な結果ではあるが、別の可能性を探る手がかりであるとも言える。もう1つの結果は、ウィッシャート分布の尺度不変なベイズ予測分布の構成である。ウィッシャート分布に対してはミニマックスな直交不変事前分布が知られていたが、同様の性質を持つ尺度不変なものは知られていなかった。これを具体的に構成することができた。 また研究分担者の田中を中心に、Textile plotおよびそれを数学的に定式化したTextile setの幾何構造を微分幾何学に加え、解析幾何学の観点からも研究した。Textile setは行列の集合M(n,p)として定義され、正則条件のもと、np - (p + 1) 次元コンパクト可微分多様体となるための十分条件を得た。この十分条件のもと、Textile setは、十分次元が高いEuclid空間から誘導されるRiemann計量をもつRiemann多様体となる。Textile set上でRiemann幾何学を展開することは今後の研究課題のひとつである。一方、Textile setから定義される2次形式の標準形を得た。これから、特に、n = p (>=2)ならば、Textile setはこの2次形式の部分集合となる。以上の研究結果は国際学会にて発表し、共著論文として掲載された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の主目的は高次元データの可視化技法の確立であった。現在までの研究により、この研究目的を遂行する上で大事なのは多次元データの座標ごとの変数変換(スケーリング)であることが明らかになった。この知見をベースとした可視化技法、総合指数の決定法、コピュラモデル、不均衡データ、Textile set に関する研究が進展した。
|
Strategy for Future Research Activity |
これまでの研究成果においてまだ明らかになっていない点を引き続き調査・検討する。具体的には、スケーリングに関する研究課題として、合否決定アルゴリズムの理論的裏付け、またコピュラモデルの代替となる分布族の構成が挙げられる。Textile setの応用に関する研究課題は、Textile setの幾何構造を、Textile plotをとおして高次元データ可視化へ反映することである。
これらの研究課題を遂行する にあたり、コピュラ理論や多変量解析はもとより最適輸送理論や機械学習の分野の研究者とも交流を図る。また成果を学術論文としてまとめるとともに、国内外の 学会において研究発表をする。さらに非線形スケーリングに基づくデータ可視化ソフトウェアを試作する。
|
Causes of Carryover |
分担者の田中について、適切な研究費利用の結果、少額を繰り越す形となっている。
|