蛋白質のアミノ酸配列レベルに働く自然選択圧を検出するにあたって、比較される塩基配列数が少なく、それぞれのコドン座位に十分な数の塩基置換が起こっていない場合には、個々のアミノ酸座位に働く自然選択圧を検出することは困難と考えられるが、そのような場合にも効率良く自然選択圧を検出できるようにするため、立体構造情報を取り入れてアミノ酸をグループ化し、グループ全体に働く自然選択圧を検出する方法を開発した。すなわち、立体構造情報が利用可能な任意の蛋白質について、立体構造においてN末端のアミノ酸のCa炭素原子の座標を中心に、ある半径の球で表される三次元ウインドウを開き、ウインドウ内にCa炭素原子が入るアミノ酸座位をグループ化して、非同義置換速度と同義置換速度を比較する。そして、前者が後者よりも大きければ正の自然選択圧、前者が後者よりも小さければ負の自然選択圧が働いていると推定する。中心となるアミノ酸をN末端からC末端へ一アミノ酸ずつ移動させることにより、ウインドウを立体構造内でスライディングさせ、正または負の自然選択圧が働いている立体構造上の領域を検出する。また、ウインドウに含まれるアミノ酸を、蛋白質の表面に存在しているか内部に埋もれているかによって分類し、表面に存在しているアミノ酸だけをグループ化して自然選択圧を検出する方法も開発した。これらの方法をインフルエンザA型ウイルスのヘマグルチニン蛋白質に適用したところ、中和抗原領域に働く正の自然選択圧を従来の方法より感度良く検出することができた。また、表面に存在しているアミノ酸だけをグループ化することにより、より感度良く正の自然選択圧を検出できることが明らかになった。 また、インフルエンザA型ウイルスのゲノムがコードする全蛋白質の全アミノ酸座位のそれぞれについて、そこに働く自然選択圧を検出した。
|