研究課題/領域番号 |
18H03211
|
研究機関 | 統計数理研究所 |
研究代表者 |
江口 真透 統計数理研究所, 数理・推論研究系, 教授 (10168776)
|
研究分担者 |
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
林 賢一 慶應義塾大学, 理工学部(矢上), 准教授 (70617274)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | コルモゴロフ / 南雲平均 / 準線形モデル / マルチモーダル / オミックス データ |
研究実績の概要 |
従来の広い意味の線形予測法を改良するために一般化平均を用いた予測法の提案を行った.説明変数の中にクラスターをモデル化し,クラスター内では線形予測子を作り,クラスター間では線形予測子を一般化平均によって非線形に結合する予測子を構築した.マルチモーダルのデータに対して予測の統合をこの一般化平均による方法で行い,新たな知見を得るために予備的な考察と準備を行った.一般化平均による予測子のスパース学習により変数選択のアルゴリズムについて検討を行っている.多様体学習の問題にこの予測法を提案し,色認知問題に適用した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
一般化平均による予測子については基本的な統計的性質,データに対する振る舞いのパターンについては確認できた.逆温度パラメーターを導入することによって温度を無限大にすると線形予測子に帰着されることから,適切な非線形性を学習することができることが分かった.時に温度が-1の時にポアソン点過程において強度関数の調和平均に対応することが分かり,従来の算術平均(重ね合わせ)より性能が良い場合があることが見つかっている.このようにデータ適用的に非線形性を計る方法も完成の域に近づきつつある.脳画像データ,ゲノムデータ,オミクスデータなどを含むマルチモーダルなデータを公開されたデータの中から得たデータセットを幾つかを予測に使えるように前処理・整理・結合を行った.
|
今後の研究の推進方策 |
一般化平均による予測において型のスパース学習アルゴリズムの高速化が実データ解析,時にマルチモーダルなデータの場合は必要である.これについて,研究グループで幾つかの方向で現段階のアルゴリズムの改良を重ねて行きたい.潜在的な異質性があるデータの問題については統計モデルの観点から理論的な解明には,ミクスチュアエクスパートとの関係を明らかにする必要があることがわかり,この方面の文献の検討を進めていきたい.脳画像データ,ゲノムデータ,オミクスデータの統合解析については小森の共同研究の中から問題点が見つかり,これについても進めていきたい.
|