2004 Fiscal Year Annual Research Report
遺伝子発現プロファイルにおけるクラスタの有意性指標の開発
Project/Area Number |
16700273
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
大羽 成征 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80362838)
|
Keywords | 遺伝子発現量 / クラスタリング / ベイズ推定 / 特徴抽出 / 球面上確率分布 / 統計的検定 / 生存時間解析 |
Research Abstract |
遺伝子発現パターンベクトルのクラスタ分析を行ったうえで、得られたクラスタの有意性を見積ることが本研究プロジェクトの目的であり、そのためには、 (ア)遺伝子発現量パターンのクラスタが生じる現象の確率的生成モデル(現象モデル) (イ)背景ノイズの確率的生成モデル(背景モデル) の二つを確立しておく必要があった。とくに(ア)現象モデルの側からは、とくに時系列に沿って測定したデータに対して、線形ダイナミカルシステムモデルに基づくパラメトリックな確率モデルを提案し、変分法的ベイズ推定の手法によってパラメータの事後分布とクラスタの個数とを推定した。この成果は情報処理学会論文集「数理モデル化と問題解決」に採録が決まり出版予定である。また、より一般的な遺伝子発現データに対して、データベクトルの方向成分のみに着目し、球面上の確率分布を考え、球面上のクラスタリングを行う手法の研究を行った。この成果に関しては国内学会での研究発表を複数行った。 ただし、これらの成果に基づく現象モデルと、適切な背景モデルとの間の比較プロセスをクラスタ有意性指標に繋げる研究は途上である。とくにカーネル密度推定によるデータ空間での密度分布クラスタを、クラスタの現象モデルとして扱うという当初のアイディアには、データ空間上での密度推定の推定分散が大きくなりがちであるという大きな問題があることが分かってきた。これに対処するためには、データ空間そのものにおいてではなく、適切な低次元特徴部分空間を考えることが本質的であろうと思われる。すなわち、クラスタを評価するための特徴部分空間とくに独立成分分析の考え方を、ここに入れ込んでいくことが有望なアイディアであると考えている。これらが来年度の研究の主要なトピックとなるであろう。 また副次的な成果としての位置付けになるが、特定時刻における生存・死亡イベントをラベルとし、発現プロファイルを特徴量として生存時間とその確率を推定する手法を開発し、特許出願を行った。またこれに加えて、Leave One Out解析を二重に使用する工夫にもとづいて分類器の分類能力を評価する手法を開発し、神経芽腫の予後推定と推定能力評価に応用した。この成果はCancer Cell誌に採録が決まり、出版予定である。
|
-
-
[Journal Article] Expression profiling using a tumor-specific cDNA microarray predicts the prognosis of intermediate-risk neuroblastomas
Author(s)
M.Ohira, S.Oba, Y.Nakamura, E.Isogai, S.Kaneko, T.Hirata, H.Kubo, T.Goto, S.Yamada, Y.Yoshida, S.Ishii, A.Nakagawara
-
Journal Title
-