2017 Fiscal Year Research-status Report
ビッグデータ時代のグラフィカルモデル推測理論の新展開
Project/Area Number |
17K00061
|
Research Institution | Doshisha University |
Principal Investigator |
原 尚幸 同志社大学, 文化情報学部, 准教授 (40312988)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | グラフ / グラフィカルモデル / ベイジアンネットワーク / 空間疫学 / 多重比較 |
Outline of Annual Research Achievements |
非巡回有向グラフが定義するグラフィカルモデルが潜在変数を含むとき、モデルは識別可能になるとは限らない。ガウスのグラフィカルモデルの場合は、Leung, Drton and Hara(2016)で潜在変数を含むモデルが識別可能になるための有用な十分条件の導出を行ったが、離散のグラフィカルモデルの場合は、識別可能になるための条件がほとんど議論されてこなかった。現状では、5次元のモデルまでの識別可能性しか知られていない。本研究では、潜在変数を1つ含み、すべての変数が2値であるグラフィカルモデルが識別可能になるための十分条件を導出した。これはLeung, Drton and Haraのガウスのモデルにおける条件を離散のモデルに拡張した結果となっている。求めた条件は十分条件ではあるが、多項式時間で判定可能な実用的な条件である。ただ、まだ十分条件であり、必要条件とのギャップを埋めることが今後の課題と言える。
また、空間疫学モデルの多重性調整p値の正確計算のアルゴリズムの提案も行った。これは、地理的な位置関係の情報のトポロジーをグラフで表現し、グラフの構造とモデルをリンクさせ、グラフが定義するマルコフ性を利用してアルゴリズムを局所化することによって効率化を測る実用的なアルゴリズムである。実データへの適用によりその有用性の確認も行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度の研究計画は、2値のベイジアンネットワークの識別可能性の十分条件の導出までであり、それは概ね解決をした。ただ、十分条件としてはまだ弱い条件ではあるので、よりよい条件の導出が望まれる。
また、多重性調整p値の計算の問題は申請後に投稿をして、本研究の枠組みで改訂作業を行い、先日査読付雑誌への掲載が確定した。これも当初の予定通りであると言える。
|
Strategy for Future Research Activity |
今後は2値から多値のベイジアンネットワークの識別可能性の十分条件の導出や、よりすぐれた十分条件(あるいは必要十分条件)の導出を目指す。また、ここで扱っているのは、モデル全体のパラメータの識別可能性であるが、特定の因果効果の識別可能性もこの枠組みで議論し、有用な条件の導出を目指す。
分割表を正確検定で検定する際に、MCMC法などのサンプリングを用いてシミュレーションによってp値を評価することが多い。しかし、モデルの次元が大きく、スパースな表の場合、定常分布(超幾何分布)への収束の遅さが問題となる。本研究では、この問題を解決するために、MCMC法と逐次重点サンプリング(SIS)のハイブリッド型のサンプリング法を提案し、正確検定の有用な実装モデルの構築を目指す。
|
Causes of Carryover |
昨年度は、理論研究が中心になったために、パソコンやソフトウエアなどの高額な設備投資が必ずしも必要でなかったため、次年度使用額が発生した。今年度は、MathematicaやMatlabなどのソフトや、パソコンなどのハードウェアへの投資をまとめて行う予定である。
|