計算幾何構造と適応サンプリングに基づく大規模生物情報処理に関する研究
Project/Area Number |
18700289
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Bioinformatics/Life informatics
|
Research Institution | Kyoto University |
Principal Investigator |
瀧川 一学 Kyoto University, 化学研究所, 助教 (10374597)
|
Project Period (FY) |
2006 – 2007
|
Project Status |
Completed (Fiscal Year 2007)
|
Budget Amount *help |
¥2,300,000 (Direct Cost: ¥2,300,000)
Fiscal Year 2007: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2006: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | 確率的計算幾何構造 / ノンパラメトリック法 / 適応サンプリング / 近接グラフ / 接近グラフ |
Research Abstract |
近年膨大なペースで蓄積されつつある生物情報データを効率的に処理するために今後は並列化を見込んだ統計手法および局所的な近接ごとのモデル化が重要性を担うと考えられる。これら大規模収集されるデータは採取次期、採取目的、種々のバイアスにより全体としては典型的な統計分布でモデル化できないため、こうしたデータの統計処理のためにはノンパラメトリックな方法論が有効であると考える。 これらの要請を元に本研究ではデータ点の統計分布そのものをパラメトリックにモデル化するのではなく、データ点が成す計算幾何的構造およびサンプリングを利用したランダマイズによるノンパラメトリック法の提案、分析、応用などを研究対象とした。種々の条件下での遺伝子発現を計測するマイクロアレイデータは形としては多変量解析で扱えるベクトルデータであるが、その分布はパラメトリックモデルでモデル化するにはノイズが多く、またサンプル数に対して次元が高い等の問題が認識されている。ここでは代謝遺伝子のデータ分布での点の近さを利用して、与えられたデータ中で顕著に共発現が見られる代謝経路を順位づけする探索法を提案した。ここでは相関係数に関する近さについて経験分布で分布関数を推定し、それを用いたスコアで正規化することで異なるデータ間での比較も可能とした。 また、並列化できるパターン識別の方法として、各クラスのサンプルを他のクラスのサンプルを含まない極大な凸包に分解するアプローチを提案し、自然な分解を定義するために近接グラフの最小全域木を利用するアルゴリズムを導出した。各判定フェーズは凸包を陽に求めず含むか含まないかという判定問題のみ解けば良いことに着目し、この問題が線形計画法に帰着することを示した。これによって高次元データに対しても適用できるようになり、実用性の向上に貢献したと言える。
|
Report
(2 results)
Research Products
(1 results)