研究課題/領域番号 |
11874018
|
研究機関 | 名古屋大学 |
研究代表者 |
尾畑 伸明 名古屋大学, 大学院・多元数理科学研究科, 助教授 (10169360)
|
研究分担者 |
勝又 義直 名古屋大学, 医学部, 教授 (30109326)
井原 俊輔 情報文化学部, 教授 (00023200)
|
キーワード | 計量文献学 / 類似性判定 / 局所的周期性 / DNA解析 / アミノ酸配列 / 情報量 |
研究概要 |
ここで問題にする配列とは、文字や数字の1次元配列のことであり、例えば、4種類のアルファベットから成るDNAの塩基配列、タンパク質のアミノ酸配列、特定の規則で作られた数字の無限列、単語配列でできている文章などを念頭に置いている。このような配列解析の問題は大きく分けて2つある。第一は個別の問題で、配列が与えられたとき(通常は極めて長大である)その配列の中に隠されている規則性を見いだすこと。第二は配列が多数与えられたときに、それらの類似性を判定することである。 目下、研究対象としている配列データは、DNAの塩基配列やタンパク質のアミノ酸配列、および単語配列としての文章である。大腸菌DNA配列に関しては、これまでに開発してきた「色彩パターン化法」の応用によって、これまでに見つかっていなかった局所的な循環配列が検出され、一定の成果をあげた(論文準備中)。タンパク質に対しては、アミノ酸の親水性・疎水性による標準的な指標を用いた色彩パターンが、大まかな分類には有効であることが示唆された。 著者の個性を識別するという観点から、日本語文章における類似性の計量化を検討している。すでに、読点の付け方によって、著者の癖が識別できる(クラスター分析による)ことが強く示唆される結果を得た。目下、同一著者の経年変化を調査するためのデータベースを作成中であり、次年度中には、一定の成果が見込まれる。 最後に、配列の類似性の数理へ向けた研究であるが、配列の「複雑さ」「階層性」「自己組織化度」を表す特性量として、配列エントロピーに付け加えるべきものを探索中である。今後は、それらを用いた計算機シミュレーションを念頭に置いた数理を展開する予定である。
|