2018 Fiscal Year Research-status Report
連続変量を含む相互情報量の推定と、グラフィカルモデルの構築への応用
Project/Area Number |
18K11192
|
Research Institution | Osaka University |
Principal Investigator |
鈴木 譲 大阪大学, 基礎工学研究科, 教授 (50216397)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 相互情報量 / 独立性検定 / 森の生成 / 因果推論 |
Outline of Annual Research Achievements |
統計的学習理論の種々の側面で、2変量に関するデータから、それらが独立であることからどれだけ乖離しているかを示す、いわゆる相互情報量を推定する状況が頻繁に生じる。その場合、サンプル数が大きくなった場合に正しい値を推定できる(一致性)ようにすることと、独立であるときに0であると推定できるようにすること(独立性検出)の両方が求められる。2変量が離散であるか連続であるかを区別しないで、一致性と独立性検出の両方の性質を満足する方法を開発することが、本研究の目的である(基本的なアルゴリズムは、本課題の着手の前に完成していて、遺伝子ネットワークの構築、および独立性検定HSICとの比較についての成果を発表している)。
本年度は、一致性の証明が完成し、また欠損データを含む場合の一般化が完成した。国際会議2件、ジャーナル1件、国内発表3件などの成果発表を行った。そして、それらの成果を含めるように、CRANで公開しているR言語のパッケージBNSLに対応する関数を追加した(2019年1月)。また、2019年1月に情報理論に関する国際会議(IEEE ISIT)に投稿した論文が、採択された。
Joe Suzuki, "Forest Learning From Data and its Universal Coding", IEEE Transactions on Information Theory, Volume: 64 Issue: 11 (2018年11月)
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね順調に進展している。本年度は、2変量が高次元である場合を検討している。提案している方法は、ヒストグラムを利用しているので、2変量とも低次元でないと、一致性が証明できても、有限サンプルで、しかも各次元が高い場合での応用はむずかしいとされた。しかし、2019年3月のコペンハーゲン大学への出張(共同研究)の際に、この問題の解決に関するヒントを得た。高次元の場合に、2変量ともクラスタリングをするということは、容易にうかぶ方法だが、それが一致性を満足する証明とどのようにつながっていくかを示さないと、問題の解決にはならない。それは、サンプルを増やした場合にクラスタが同じものに収束するという、クラスタリングの一致性との関連である。
|
Strategy for Future Research Activity |
2変量が高次元の場合の一般化に関しては、論文に投稿して審査中である。
さらに、相互情報量の推定をの用いた、因果推論への応用を新たに検討している。この問題は、高次元の変数に対する相互情報量の推定問題が解決したことのインセンティブになっている。また、既存の変数間の順序を決める方法の問題点を改善している。
|
Causes of Carryover |
支出をともない理論的な研究の部分について研究が大幅に進んだ。しかし、それ以外に関しては、平成31年度に行うことになった。研究全体としては、順調であるとみている。
|
Research Products
(8 results)