1. 二値判別機の出力を組合せて多クラスの分類問題を実行する枠組みにおいて、統計学的な観点から有効な判別機の組合せの方法論の開発に関する研究を行った。本研究において提案された手法は、既存の二値判別機の組合せ手法よりも多くの場合に性能が優れている。さらに、予測の不確実性を考慮するために各々のクラスの確率値を出力することができ、また、L1ペナルティを加えた最適化行うことで最終的なクラスラベルの決定に必要でない判別機を除去することができる。前年までに手法の概要はある程度できていたが、本年度は数値実験をさらに充実させ、どういった場合に提案手法の性能が特に向上するか等の考察を加え、論文にまとめた。本研究の内容は、統計関連学会連合大会で発表され、国際学術誌に投稿中である。 2. 複数のモデルの組合せという観点から、遺伝子の転写制御ネットワークを推定する統計手法の開発を行った。発生や細胞の癌化などのメカニズムを理解するためには、遺伝子同士の相互関係、すなわちネットワークの推定が不可欠である。単一の環境下において採取された遺伝子の発現プロファイルからは、どうしてもそれを説明するネットワークに冗長性が生じ、正確な推定が実行できないという問題点があった。そこで、複数の環境下における発現データを同時に扱い、それらを組合せてネットワークを推定するための統計モデルを開発した。また、提案手法を実際の生物データに適用し、生物学的な観点においても合理的な結果を導くことを示した。本研究の内容は、国際会議International conference on Intelligent Systems for Molecular Biologyや統計関連学会連合大会で発表され、国際学術誌に条件付き採録されている。
|