研究概要 |
長大な1次元配列データに潜むであろう様々な規則性を効率よく探索することは、そのようなデータの取り扱いが必要となる研究分野でしばしば問題となる。それぞれの配列毎の情報解析と複数の配列間の近親性を把握するために、本研究では、主に遺伝子の情報解析に示唆される形で、1次元配列を2次元するとともに色彩を与える手法(色彩パターン化)を開発し、特許申請(大澤研二・尾畑伸明・吉田徹彦:記号列の特徴顕在化方法、特許出願中、特願平9-223908)した。 目下、研究対象としている1次元配列データは、(a)4種類の塩基配列であるDNA(b)20種類のアミノ酸配列であるタンパク質(c)時系列などで扱われる,長大な数字列または数値列(d)単語列または音韻列としての文章などであるが、幅広く対象を捉えるよう留意している。これらに共通する、探索すべき性質は、その配列の持つ局所的周期性・リピート単位の発見・100以上の長周期・特定の文字の分布状況・長距離相関などのより大域的な構造である。これらは、1次元配列の中から特定の機能を持つ部位を特定したり,複数の配列の類似性を検証するために鍵となるが、一般には、長大な配列の中に埋没しているめ発見する工夫が必要なのである. 具体例としては、ヒト・イ-スト菌・大腸菌などのDNA塩基配列、ミオシン重鎖・コラーゲンなどのアミノ酸配列、数(循環小数・円周率・対数の底など)の十進展開、疑似乱数や非線形漸化式の発生する数列、文章における母音配列などに色彩パターンの類似性や分類などの議論が望まれるところである.
|