2007 Fiscal Year Annual Research Report
タンパク質発現量の推定を可能にする新規プロテオームデータ解析法の開発
Project/Area Number |
18650077
|
Research Institution | Hiroshima University |
Principal Investigator |
石野 洋子 Hiroshima University, 大学院・理学研究科, 特任准教授 (90373266)
|
Keywords | プロテオーム情報処理 / 量子化学計算 / 帰納学習 |
Research Abstract |
本年度は、質量分析で検出される個々のペプチドイオン強度(理論値)のモデルを構築し、実測データとのパターンマッチングを工夫することで、質量分析におけるタンパク質発現量を推定する方法を開発することを目標に以下のとおり研究を実施した。 1.プロテオームデータからの遺伝子アノテーション 検討に用いるプロテオームデータ(MS/MS)の質を確認し検索ソフトウェアMascot(Matrixscience社)の詳細なアルゴリズムを理解するために、直接ゲノムDNAの塩基配列データベースに対してMS/MSのペプチド検索を行い、ゲノム配列上にマップすることを試みた。これにより、(1)ペプチドの位置と既存のアノテーションとを比較することで配列やアノテーションの間違いを検出する、(2)単純な遺伝子検出プログラムを組み合わせることで新規遺伝子を予測する、という2つを可能にした。 2.ジペプチドのC-N結合エネルギー計算 2つのアミノ酸が結合したジペプチドのC-N結合エネルギーを量子化学計算で求めることを目標に、量子化学計算を行った。計算レベルの検討を踏まえ、構造最適化およびエネルギー計算にはHF/6-31G(d)を用いて計算を行った。この計算には、広島大学量子生命科学プロジェクト研究センターが所有しているPCクラスターを使用し、ジペプチド全400パターンのC-N結合エネルギーの結果を得た。 3.帰納学習の検討 2で求めた値を核として、ペプチドイオン強度に対する基礎的な理論付けを試みた。その際、個別の差異を吸収するのに帰納学習を用いた。訓練データからの学習効果は見られたものの、満足のいく予測精度を得るためには帰納学習部分で用いる属性値の検討をさらに重ねる必要がある。 本年が最終年度であるが、より正確に発現量推定を行うシステムの構築について今後さらに検討を深めたいと考えている。
|
Research Products
(3 results)