研究課題
遺伝子発現パターンベクトルのクラスタ分析を行ったうえで、得られたクラスタの有意性を見積ることが本研究プロジェクトの目的であり、そのためには、(ア)遺伝子発現量パターンのクラスタが生じる現象の確率的生成モデル(現象モデル)(イ)背景ノイズの確率的生成モデル(背景モデル)の二つを確立しておく必要があった。とくに(ア)現象モデルの側からは、とくに時系列に沿って測定したデータに対して、線形ダイナミカルシステムモデルに基づくパラメトリックな確率モデルを提案し、変分法的ベイズ推定の手法によってパラメータの事後分布とクラスタの個数とを推定した。この成果は情報処理学会論文集「数理モデル化と問題解決」に採録が決まり出版予定である。また、より一般的な遺伝子発現データに対して、データベクトルの方向成分のみに着目し、球面上の確率分布を考え、球面上のクラスタリングを行う手法の研究を行った。この成果に関しては国内学会での研究発表を複数行った。ただし、これらの成果に基づく現象モデルと、適切な背景モデルとの間の比較プロセスをクラスタ有意性指標に繋げる研究は途上である。とくにカーネル密度推定によるデータ空間での密度分布クラスタを、クラスタの現象モデルとして扱うという当初のアイディアには、データ空間上での密度推定の推定分散が大きくなりがちであるという大きな問題があることが分かってきた。これに対処するためには、データ空間そのものにおいてではなく、適切な低次元特徴部分空間を考えることが本質的であろうと思われる。すなわち、クラスタを評価するための特徴部分空間とくに独立成分分析の考え方を、ここに入れ込んでいくことが有望なアイディアであると考えている。これらが来年度の研究の主要なトピックとなるであろう。また副次的な成果としての位置付けになるが、特定時刻における生存・死亡イベントをラベルとし、発現プロファイルを特徴量として生存時間とその確率を推定する手法を開発し、特許出願を行った。またこれに加えて、Leave One Out解析を二重に使用する工夫にもとづいて分類器の分類能力を評価する手法を開発し、神経芽腫の予後推定と推定能力評価に応用した。この成果はCancer Cell誌に採録が決まり、出版予定である。
すべて 2005 その他
すべて 雑誌論文 (2件) 産業財産権 (1件)
情報処理学会誌論文集「数理モデル化と問題解決」 (発表予定)
Cancer Cell (発表予定)