2012 Fiscal Year Research-status Report
系統樹の剪定による遺伝子配列データリサンプリングアルゴリズム
Project/Area Number |
24700289
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
米澤 弘毅 長浜バイオ大学, バイオサイエンス学部, 助手 (00374744)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | バイオインフォマティクス / 人獣共通感染症 / リサンプリング / 分子系統樹 |
Research Abstract |
近年,インフルエンザを始め様々な病原体の遺伝子情報が近年,データベース上に大量に蓄積されている.しかし,データセットの巨大化に伴い,多重配列アラインメント,進化系統解析,相同性検索等の解析が困難になりつつある.また,各国における感染症サーベイランス能力の差異により,データセットにサンプリングバイアスを含んでいる可能性がある.そこで本研究では,サンプリング密度の濃い部分に存在する配列を適宜取り除くことによってリサンプリングを行うアルゴリズムを提案した. ユーザによって与えられた剪定する配列数の閾値に達するまで以下の動作を繰り返す.系統樹に存在する全ての近隣ペアのうち相互の系統樹上の距離が最も小さいものを見つけ出し,ペアのうち共通の親ノードからの距離が近い方の配列を剪定する.申請者らは平成24年度において,リサンプリング手法に対する評価手法として,①除去された配列とリサンプルされた配列との類似度の高さ,②リサンプルされた配列の塩基多型度の高さ,および③リサンプルされた配列の分離年についての標準偏差の減少の程度を評価手法と定めた.そしてこれらの評価手法に従い,申請者らのリサンプリングアルゴリズムが他の手法に比べて十分な能力を持つことを示した. また,申請者らの手法をA型インフルエンザウイルスにおける各セグメントの翻訳領域の1万本を超える塩基配列から1千本ずつリサンプルを実行し,ウイルスの内部および外部に発現するタンパク質をコードする塩基配列について,宿主による多様性に大きな差が確認された.この事実は,過去に実験によって明らかにされている知見と一致するものである.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成24年度の目標であった,リサンプリング手法の設計および評価手法の確立は実現できた.また,申請者らの手法を用いてインフルエンザウイルスのパッケージングの解明に役立つ手法の確立も行われている.しかしながら,平成25年度に向けた準備として申請者らの手法を一般に公開する計算サーバの入手およびサービスの実装にはまだ着手できていないため,(2)の評価とした.
|
Strategy for Future Research Activity |
平成25年度の計画通り,主に申請者らの手法をHCV,CIV,さらにはHIVといった様々な病原体の配列データに適用することを主眼として,ウェブ上に一般公開する作業を行う.この際,ウェブサービスとして提供するために申請者らの手法を改良する必要が生じたため,本手法の近隣結合法をベースにした手法への変更が必要になる.また,可能であれば申請者らの手法をNCBI Influenza Virus ResourceのBao氏らに利用可能にしてもらうように働きかけを行う.
|
Expenditure Plans for the Next FY Research Funding |
平成24年度には予定していた予算を40万円ほど使用していない.この理由は,平成25年度に申請者らの手法をウェブサービスとして公開する際,そのためのウェブサーバおよびそれに関わる作業を外部委託するための資金が予定より多く必要となる可能性が生じたためである. 平成25年度は申請者らの手法をウェブサービスとして提供するための計算サーバを購入する.この際,ウェブサービスとして公開するために外部委託を行うことを計画中であり,現在は委託する候補を探している段階である.また,開発および研究成果を論文として発表する際に必要な各種ソフトウェアや校閲等に必要な人件費に使用することを計画している.
|