2001 Fiscal Year Annual Research Report
Project/Area Number |
12208003
|
Research Institution | The University of Tokyo |
Principal Investigator |
森下 真一 東京大学, 大学院・新領域創成科学研究科, 助教授 (90292854)
|
Co-Investigator(Kenkyū-buntansha) |
西田 友是 東京大学, 大学院・新領域創成科学研究科, 教授 (10131690)
阿久津 達也 京都大学, 化学研究所, 教授 (90261859)
後藤 修 独立行政法人産業技術総合研究所, 生命情報研究センター, 主任研究員 (40142111)
|
Keywords | バイオインフォマティクス / ヒトゲノム / データマイニング / アラインメント / 遺伝子予測 / アミノ酸モチーフ / アルゴリズム / データベース |
Research Abstract |
ゲノム統合データベースからの知識発見の中でも重要な以下の4つのテーマに取り組み成果を収めた。 (テーマ1)約400万個のESTをヒトゲノムドラフト配列に約1日以内に写像する技術を完成した。類似するソフトウエアsim4やBLATと比較して、写像感度をほぼ保持したまま、速度を1桁から3桁改善することに成功した。WebサイトはFl1ashを用いて動的に内容が変化するGUIを実現した。 (テーマ2)ACM SIGKDD主催のKDD Cupにおいて、遺伝子細胞内局在化部位予測部門で第1位(参加45チーム中)、遺伝子機能予測部門で第3位(参加41チーム中)の成果を収めた。その際、近接点探索に基づくクラス分類アルゴリズムの新手法を提案し、最悪計算量を評価し(NP困難)、現実的に高速に動く分岐限定法を新しく研究開発した。 (テーマ3)全ゲノム配列が解読された4生物種につき、それぞれ1〜4万のイントロン挿入部位を同定し、種に固有な境界シグナルの導出を可能とした。イントロンの長さの分布や通常のギャップをより現実的にモデル化できるようにアルゴリズムを拡張した。二組のテスト用ヒト遺伝子データセットに対して、開発したプログラム(aln)の予測精度を検証した。ヒト固有の統計情報を使用することと、アルゴリズムの拡張によって、エクソンレベルで4〜5%、遺伝子レベルでは10%以上予測精度が向上することを確かめた。 (テーマ4)発現データに基づく細胞の自動分類のために、相対エントロピー最大化に基づいたアルゴリズムを開発した。また、隠れ変数のあるネットワークの推定のために、共分散構造分析の適用を試みた。一方、配列データからのモチーフ検出法してGIBBSサンプリングに基づく手法が知られている。本研究では、この方法を数値列データに適用できるように拡張した。このことにより、アミノ酸の物理化学的性質に基づくモチーフ検出や、立体構造に基づくモチーフ検出がある程度可能となった。また、位置依存スコア行列の推定法に関して論的研究を行った。
|
Research Products
(8 results)
-
[Publications] Toshihiko Honkura, Jun Ogasawara, Tomoyuki Yamada, Shinichi Morishita: "The Gene Resource Locator : gene locus maps for transcriptome analysis"Nucleic Acids Research. 30, 1. 221-225 (2002)
-
[Publications] Jie Cheng, Christos Hatzis, Hisashi Hayashi, Mark-A. Krogel, Shinichi Morishita, David Page, Jun Sese: "KDD Cup 2001 Report"ACM SIGKDD Explorations. (印刷中). (2002)
-
[Publications] Shinichi Morishita: "Computing Optimal Hypotheses Efficiently for Boosting"Progresses in Discovery Science. (印刷中). (2002)
-
[Publications] Yasuhiko Morimoto, Hiromu Ishii, Shinichi Morishita: "Efficient Construction of Regression Trees with Range and Region Splitting"Machine Learning. 45. 235-259 (2001)
-
[Publications] Takeshi Fukuda, Yasuhiko Morimoto, Shinichi Morishita, Takeshi Tokuyama: "Data Mining with Optimized Two-Dimensional Association Rules"ACM Transactions on Database Systems. 26, 2. 179-213 (2001)
-
[Publications] Jun Sese, Hitoshi Nikaidou, Shoko Kawamoto, Yuichi Minesaki, Shinichi Morishita, Kousaku Okubo: "BodyMap incorporated PCR-based expression profiling data and a gene ranking system"Nucleic Acids Research. 29, 1. 156-158 (2001)
-
[Publications] Tatsuya Akutsu: "A local search algorithm for local multiple alignment : special case analysis and application to cancer classification"The 2001 International Conference on Parallel and Distributed Processing Techniques and Applications. 1284-1290 (2001)
-
[Publications] 森下 真一, 久光 徹, 高木 利久: "特集 ゲノム情報科学"情報処理学会. 41 (2002)