• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1999 年度 実績報告書

配列情報の基礎数理

研究課題

研究課題/領域番号 11874018
研究機関名古屋大学

研究代表者

尾畑 伸明  名古屋大学, 大学院・多元数理科学研究科, 助教授 (10169360)

研究分担者 勝又 義直  名古屋大学, 医学部, 教授 (30109326)
井原 俊輔  情報文化学部, 教授 (00023200)
キーワード計量文献学 / 類似性判定 / 局所的周期性 / DNA解析 / アミノ酸配列 / 情報量
研究概要

ここで問題にする配列とは、文字や数字の1次元配列のことであり、例えば、4種類のアルファベットから成るDNAの塩基配列、タンパク質のアミノ酸配列、特定の規則で作られた数字の無限列、単語配列でできている文章などを念頭に置いている。このような配列解析の問題は大きく分けて2つある。第一は個別の問題で、配列が与えられたとき(通常は極めて長大である)その配列の中に隠されている規則性を見いだすこと。第二は配列が多数与えられたときに、それらの類似性を判定することである。
目下、研究対象としている配列データは、DNAの塩基配列やタンパク質のアミノ酸配列、および単語配列としての文章である。大腸菌DNA配列に関しては、これまでに開発してきた「色彩パターン化法」の応用によって、これまでに見つかっていなかった局所的な循環配列が検出され、一定の成果をあげた(論文準備中)。タンパク質に対しては、アミノ酸の親水性・疎水性による標準的な指標を用いた色彩パターンが、大まかな分類には有効であることが示唆された。
著者の個性を識別するという観点から、日本語文章における類似性の計量化を検討している。すでに、読点の付け方によって、著者の癖が識別できる(クラスター分析による)ことが強く示唆される結果を得た。目下、同一著者の経年変化を調査するためのデータベースを作成中であり、次年度中には、一定の成果が見込まれる。
最後に、配列の類似性の数理へ向けた研究であるが、配列の「複雑さ」「階層性」「自己組織化度」を表す特性量として、配列エントロピーに付け加えるべきものを探索中である。今後は、それらを用いた計算機シミュレーションを念頭に置いた数理を展開する予定である。

  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] 尾畑伸明、他4名: "作者の統計的識別の一例"人文科学における数量的分析(統計数理研). 4. 51-60 (1999)

  • [文献書誌] 尾畑伸明、大澤研二、吉田徹彦: "A method of sequential analysis by 2D-pattern formation with coloration"Amino Acids. 17. 121-121 (1999)

  • [文献書誌] 尾畑伸明、大澤研二、吉田徹彦: "A method for information analysis of sequences by two-dimensional pattern formation with coloration"in"Quantum Information (T.Hida et al,eds.)". 27-58 (1999)

URL: 

公開日: 2001-10-23   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi