• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2000 年度 実績報告書

配列情報の基礎数理

研究課題

研究課題/領域番号 11874018
研究機関名古屋大学

研究代表者

尾畑 伸明  名古屋大学, 大学院・多元数理科学研究科, 助教授 (10169360)

研究分担者 大澤 研二  名古屋大学, 大学院・多元数理科学研究科, 助教授 (50203758)
勝又 義直  名古屋大学, 大学院・医学研究科, 教授 (30109326)
井原 俊輔  名古屋大学, 情報文化学部, 教授 (00023200)
キーワード色彩パターン化法 / DNA配列解析 / アミノ酸配列解析 / 計量文献学 / 類似性判定 / 情報量 / 局所的周期性
研究概要

文字や数字の1次元配列のデータ解析にあたり、特に、4種類のアルファベットから成るDNAの塩基配列、タンパク質のアミノ酸配列、特定の規則で作られた数字の無限列、単語配列でできている文章などを念頭に置き、分野融合的な研究を試みた。本研究における課題は大きく分けて2つある。第一は個別の問題で、配列が与えられたとき(通常は極めて長大である)その配列の中に隠されている規則性を見いだすこと。第二は配列が多数与えられたときに、それらの類似性を判定することである。具体的な研究対象は、DNAの塩基配列やタンパク質のアミノ酸配列、および単語配列としての文章である。
長大な配列に潜む規則性を探査する為に「色彩パターン化法」(平成12年12月に特許査定)を開発し、大腸菌DNA配列に応用し、これまでに見つかっていなかった局所的な循環配列を検出した。タンパク質に対しては、アミノ酸の親水性・疎水性による標準的な指標を用いた色彩パターンが、大まかな分類には有効であることが示唆された。著者の個性を識別するという観点から、日本語文章における類似性の計量化を検討し、読点の付け方によって著者の癖が識別できる(クラスター分析による)ことが強く示唆される結果を得た。同一著者の経年変化を含め精査するために、約50万語からなる形態素分解データベースを作成中であるが校正に膨大な時間を要している。データ解析の理論面を強化するために、配列の「複雑さ」「階層性」「自己組織化度」を表す特性量として、配列エントロピーに付け加えるべきものを探索すべきであるが、形態素解析データベースの完成を待って、理論と実験を融合させ、この目標に向けた試論を展開する予定である。このように、いくつかの具体的な成果に加え、多くの課題を掘り起こすこととなり、より組織的な研究が必要となっっている。

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] K.Oosawa,N.Obata.T.Yoshida: "Colour-coding reveals tandem repeats in the Escherichia coli genome"J.Molecular Biology. 298. 343-349 (2000)

URL: 

公開日: 2002-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi