本研究は、転写制御を符号論的に解釈した場合に出現する偽発現の概念を提案するものである。偽発現とは遺伝子がシス制御因子のパターンのみに従って発現すると仮定した場合に、純粋に理論上のみで発生する現象である。 本研究の目的は、なぜ偽発現が実際の細胞では起こらないのかを、モデル解析によって明かにすることである。具体的にはシス制御因子を網羅的に推定することによって偽発現に相当するパターン干渉が観測できるか、および回避モデルとして転写因子の相互作用モデルを提案し、パターン干渉が回避できるかを検証する。 本年度は、プロモータ配列から保存部分配列を検出するようなモチーフ抽出の手法に関して、既知のモチーフ抽出手法との性能比較等を行った。通常、モチーフ抽出の手法は、比較的少ない配列セットに関して適用され、かつ単一のモチーフを抽出することを目的に行われる。しかしながら、本研究では全ゲノムのモチーフパターンを対象とするため、必然的に大規模な配列セットを扱い、かつ複数のモチーフを抽出しなければならない。従来の評価手法では、このような大規模かつ複数モチーフ抽出の性能を評価することは困難であるため、新たに評価手法を確立した。結果として、少数の配列セットに関しては、従来法が提案法に比べ高性能であるものの、本研究が対象としている大規模な配列セットに関しては、提案法が有利であることが示された。本提案手法を用いて、抽出されたモチーフをシス制御因子とみなして、シス制御因子パターンの解析を行う。
|