研究課題/領域番号 |
25870336
|
研究機関 | 京都大学 |
研究代表者 |
BROWN John 京都大学, 医学(系)研究科(研究院), 助教 (90583188)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | マイクロアレイ / トランスクリプトーム / 分子相互作用 / 臨床情報 / オミックス |
研究実績の概要 |
本年度は遺伝子発現量データを解析することに集中し、2種類のデータを扱うための基盤処理プログラムを設計し実装しました。該当年度の前半にはマイクロアレイデータを対象とし、GEOなどの公開データベースに保管されているデータを抽出し発現量解析パイプラインを作成しました。また、例えば同じ細胞腫を解析対象にしても各マイクロアレイの技術の仕様によって得られる発現量が異なるため、複数のマイクロアレイデータを統合する場合は正規化処理法も実装する必要があり、今回そのような実装をしました。 作成したソフトに基づいて、京都大学医学部附属病院に所属する臨床医と共同研究を行い、妊娠中毒症(pre-eclampsia)の検体と正常の検体の遺伝子発現量解析を実施しました。その結果、妊娠中毒症の因子となるパスウェイを予測した結果が、共同研究チームの生物学的実験結果と一致しました。この共同研究結果を査読有の学術論文で発表しました。 本年度の後半では、マイクロアレイ技術より発現パターンを大幅に検出できるRNAseq技術に対して、改めて解析基盤を作成しました。この基盤パイプラインでは、シーケンサー機械から得られる塩基配列データを用いて、(1)品質管理と事前処理(2)対象生物の標準配列(reference genome, reference transcriptome)に対するアラインメント(3)アラインメントによる発現量算出、の順に処理を行います。 RNAseq解析パイプラインの応用として、京都大学医学研究科の研究チームと共同研究を計画し、複数の時点と複数の養成条件で計測されたマウスRNAseq情報を処理し、解析結果の解釈を始めました。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
相互作用ネットワーク同士の類似度計算法と計算実装は遅れています。特に、当初扱った相互作用データは相互作用されないデータがとても少ないため、他の相互作用データベースを調べて研究への応用性を評価する必要がありました。相互作用されないデータを多めに含めるデータベースは見つけることができましたが、そのデータベースを扱うためにプログラムを書く必要があって時間がかかりました。
|
今後の研究の推進方策 |
今年度は遺伝子発現量データの基本処理をする基盤と、相互作用されない化合物とタンパク質の組み合わせを含めるデータの確保ができましたので、ネットワークのモデリングに再び集中します。まずは相互作用のデータから膨大な相互作用ネットワークを作成し、ネットワークの統計的な性質を解析します。相互作用データの中、アッセイ条件などの情報も入っている場合がありますので、この情報を用いて全体な相互作用ネットワークをアッセイ条件毎にろ過し、得られるネットワークを可視化し同様に統計的に解析します。 もう一方、時系列の遺伝子発現データから、観測時点毎のネットワークを作成します。具体的に、発現データに発現されるタンパク質と発現されないタンパク質があり、この情報をタンパク質同士相互作用データと照らし合わせることにより、観測時点毎のタンパク質同士相互作用ネットワークが得られます。ここで得られるネットワークは、一つの生物的な条件に対するもので、各実験条件からネットワークを同様に得られます。これで時間毎と条件毎にネットワークが得られ、各ネットワークに対し、相互作用データから構成したネットワークと照らし合わせて、化合物とタンパク質の相互作用情報を追加します。 多数なネットワークの生成が終われば、次はネットワーク類似度計算方法と新規な相互作用を予測するアルゴリズムを行います。従来の研究では相互作用の有無が不明であるタンパク質と化合物の組みに対して、他のタンパク質と化合物の組みとの類似度を計算し相互作用を予測しましたが、従来の方法は時間と実験条件の背景情報が入っていませんでしたので、今回作成する予測法ではこの背景情報を用いたネットワークを使用してtime and context-aware相互作用類似度計算をします。これにより機械学習の予測精度を評価し、創薬への期待を評価します。
|