19年度までの成果に加えて、20年度では以下の三点に進展が得られた。第一に行列因子化モデルを前提とした多重検定法を開発した。この手法は、19年度に得られた2つの成果(1)行列因子化の確率的モデルをヘテロデータに拡張したヘテロ成分分析モデル(HCA)および(2)隠れ変数モデルを前提とした多重検定手法(HODP)の統合手法であり、本研究課題で当初目標としていたアイディアの骨子を全て実装した手法と位置づけられる。本手法によれば、ヘテロ性や欠測を含む行列であっても全て一段階抽象化された行列成分で代表され、遺伝子有意性検定などの知識抽出処理は抽象化された世界で行うことができる。この研究は「ニューラルコンピューティング研究会」ほかで発表されIEEE Computational Interigence Society JapanよりYoung Researchers Awordを受賞した。また第二に、行列因子化においてデジタル値を扱うこともできるようにした。これは既存のマージン最大化行列因子化法に新たにベイズ的モデル選択の考え方を導入して性能向上を図ったものであり、本研究課題におけるヘテロデータ処理に不可欠な部品と位置づけられる。第三に、ヘテロ成分分析モデル(HCA)の学習アルゴリズムの加速を実現した。モデル自由度の自動選択に関わるハイパーパラメタ学習を含むEMアルゴリズムには遅滞の起こる箇所があることが分かっていたが、これを回避することによって収束速度の大幅向上が得られ、大型データへの応用可能性が高まった。第三の成果については未発表であり論文の準備中である。最後に特記事項として、本研究課題から派生した研究テーマがJSTさきがけで採択され、今後とも発展的に継続の予定であることを記しておく。
|