2017 Fiscal Year Research-status Report
高次元データの理解のための最適なスケーリングと可視化技法
Project/Area Number |
17K00044
|
Research Institution | The University of Tokyo |
Principal Investigator |
清 智也 東京大学, 情報理工学(系)研究科, 准教授 (20401242)
|
Co-Investigator(Kenkyū-buntansha) |
田中 潮 大阪府立大学, 理学(系)研究科(研究院), 助教 (60516897)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 行列のスケーリング / 可視化 / Textile plot / 多変量データ / エントロピー |
Outline of Annual Research Achievements |
研究代表者の清は,多次元確率分布のスケーリング問題について取り組んだ.統計学で扱うデータは多変量であることが多いが,その総合指数を計算したい場合,各成分のスケーリングの任意性が問題となることがある.本研究ではスケーリングした後の確率分布が,ある意味でエントロピーを最大化するように一義的に決められることを示した.この結果は特に複数の指標から個体のランキングや合否を決める際の一手法としての活用が期待される.技術的には多次元確率分布の従属性を詳しく調べる必要があり,今後研究すべき対象がより明確になったと言える.また,関連する話題として,スケーリングを決める重みの標本分布について,統計的漸近理論を展開した. また研究分担者の田中を中心に,TextilePlot から定まる多様体の構造を調べた。TextilePlotは,高次元データを可視化する一手法である.本研究の目的は,これを数学的に定式化したTextileSetの幾何学的性質を明らかにすることである.我々は,本研究の先行研究に引き続く問題として,次の問題の提案を受けた:‘TextileSetの幾何学的性質により,データの構造を調べよ’.これにより,与えられたデータに関する情報量が豊富になり,効率良いデータ解析が期待できる.得られた結果として,データ行列の共分散行列の最大固有値に対応する固有ベクトルとデータ行列との関係を明らかにした. これらの成果の一部は国際研究集会において発表し,活発な議論を促すことができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究目的である「高次元データの可視化技法の確立」を実現するために必要な,非線形スケーリング手法ならびに Textile set の幾何学的特徴付けについて,理論と応用の両面で進展が得られた。
|
Strategy for Future Research Activity |
前年度の研究成果を踏まえ,Textile set の非線形化について検討する。引き続き研究代表者と研究分担者で綿密な議論を行い,以下の点を明らかにする: 非線形スケーリング問題の理解と応用,非線形 Textile Set の微分幾何学的特徴付け,シェイプ理論の援用,データの高次元性に起因する困難の把握,データ属性の違いによる分類。 これらを達成するために関連分野の研究者との意見交換も行う。また,一定の成果が得られた段階で学術論文としてまとめるとともに,研究集会において発表する。
|
Causes of Carryover |
研究代表者の清について,事情により当初予定していた国際会議に参加せず,その分の旅費を使用しなかったため。
次年度は,当該年度に得た研究成果を多くの国際会議で発表し,また国際交流を図るため,その分の旅費として助成金を使用する予定である。
|