二次元色彩化を用いてゲノム中のタンデムリピートを探索する目的で開発した方法を、インフルエンザ菌に適用し、30塩基以上の反復長のタンデムリピートを30個見いだした。インフルエンザ菌では大腸菌とは異なり100塩基前後の長さのリピートは割合として多くないなどの特徴を示した。一方、ゲノム全体に関して特徴を見いだすために、表示幅を一定にして単一の彩色図を作成する手法を用いて、様々なゲノムを解析した。すると、細菌において、それぞれに特徴的な色パターンを示しているのに加えて、枯草菌ゲノムではGC相対比などに応じたパターンが顕在化したのに対して、大腸菌ゲノムではそれが明確にならなかった。これは、色彩化においてそれぞれの塩基の種類に対応する色彩の選択が特徴の顕在化に重要な因子の一つであることを示しており、現在それらのさらなる検討を進めている。また、ヒトゲノムについては、幅の設定により顕在化するパターンがあった。 二次元色彩化によるパターン顕在化は色彩の選択によるところが大きいが、今後顕在化されたパターンの分類や探索の自動化などを行ううえで重要な要素の一つにパターンの形の抽出・分類があることが、明らかになりつつある。この方面の研究をさらに発展させるためには、形の認識などに詳しい視覚心理学の分野との共同研究を実施して行く必要がある。一方、タンデムリピートの探索などに用いる配列の自動処理に関しても、ウェブサイト上での構築を視野に入れて開発・検討を行っている.
|