2001 Fiscal Year Annual Research Report
Project/Area Number |
12208002
|
Research Institution | The University of Tokyo |
Principal Investigator |
中井 謙太 東京大学, 医科学研究所, 助教授 (60217643)
|
Co-Investigator(Kenkyū-buntansha) |
丸山 修 九州大学, 大学院・数理学研究院, 助教授 (20282519)
宮野 悟 東京大学, 医科学研究所, 教授 (50128104)
|
Keywords | DNAモチーフ抽出 / 局在化シグナル / 完全長cDNA / レギュロン予測 |
Research Abstract |
1 当初の研究計画ではDNA塩基配列データからのモチーフ抽出プログラムの性能評価に重点を置く計画であった。すなわち、共通の転写因子結合部位を含むことが期待される一群の塩基配列を与えられたときにそのモチーフを発見することが、どの程度プログラムで可能なのか、またパラメータ値を変化させることで結果が殿程度変わるのかを確かめることで、現状のアルゴリズムの問題の把握と新たな改良の糸口をつかむことを考えていた。そこで、まずいろいろなモチーフ抽出プログラムの結果や、一つのプログラムに対していくつか異なるパラメータ指定をしたときの結果の違いをグラフィカルに表示するプログラムMelinaを開発し、公開した。現在、ランダムに発生させた人工配列を用いて、より詳細な解析を行っている。 2 情報科学の立場からDNAモチーフ配列の共起性に着目し、共起シグナル配列をとらえるモデルの定式化を行った。さらに、これらを探索するビット演算に基づくアルゴリズムの設計と計算機実験によるモデルの有効性の検証を行った。 3 前年度に開発したタンパク質のN末端局在化シグナル認識プログラムiPSORTをOCamlという言語で実装し、コマンドラインで実行できるようにした。プログラムは非営利の利用にはフリーで配付している。 4 菅野純夫氏(東大医科研)のグループとの共同研究で、彼らが決定したヒト遺伝子転写物5'末端配列をゲノム上にマップしたデータベースDBTSSを構築した。このデータベースを現在種々の角度から解析しており、すでにいくつか興味深い観察を行っている。 5 以前に構築した枯草菌の転写因子とその結合部位に関するデータベースDBTBS(http://elmo.ims.u-tokyo.ac.jp/dbtss/)に、比較ゲノム研究に基づく予測レギュロンの表を追加した。
|
-
[Publications] Hishigaki, H.: "Assessment of prediction accuracy of protein function from protein-protein interaction data"Yeast. 18・6. 523-531 (2001)
-
[Publications] Yada, T.: "A novel bacterial gene-finding system with top-class accuracy in locating start codons"DNA Research. 8・3. 97-106 (2001)
-
[Publications] Naoki, K.: "Prediction of in vivo fates of proteins in the era of genomics and proteomics"Journal of Structural Biology. 134・2/3. 106-116 (2001)
-
[Publications] Terai, G.: "Prediction of co-regulated genes in Bacillus subtilis on the basis of upstream elements conserved across three closely related species"Genome Biology. 2・11. 0048-1-0048-12 (2001)
-
[Publications] Suzuki, Y.: "DBTSS : database of human transcriptional start sites and full-length cDNAs"Nucleic Acids Research. 30・1. 328-331 (2002)
-
[Publications] Bannai, H: "Extensive feature detection of N-terminal protein sorting signals"Bioinformatics. 18・2. 298-305 (2002)