1999 Fiscal Year Annual Research Report
Project/Area Number |
11874018
|
Research Institution | Nagoya University |
Principal Investigator |
尾畑 伸明 名古屋大学, 大学院・多元数理科学研究科, 助教授 (10169360)
|
Co-Investigator(Kenkyū-buntansha) |
勝又 義直 名古屋大学, 医学部, 教授 (30109326)
井原 俊輔 情報文化学部, 教授 (00023200)
|
Keywords | 計量文献学 / 類似性判定 / 局所的周期性 / DNA解析 / アミノ酸配列 / 情報量 |
Research Abstract |
ここで問題にする配列とは、文字や数字の1次元配列のことであり、例えば、4種類のアルファベットから成るDNAの塩基配列、タンパク質のアミノ酸配列、特定の規則で作られた数字の無限列、単語配列でできている文章などを念頭に置いている。このような配列解析の問題は大きく分けて2つある。第一は個別の問題で、配列が与えられたとき(通常は極めて長大である)その配列の中に隠されている規則性を見いだすこと。第二は配列が多数与えられたときに、それらの類似性を判定することである。 目下、研究対象としている配列データは、DNAの塩基配列やタンパク質のアミノ酸配列、および単語配列としての文章である。大腸菌DNA配列に関しては、これまでに開発してきた「色彩パターン化法」の応用によって、これまでに見つかっていなかった局所的な循環配列が検出され、一定の成果をあげた(論文準備中)。タンパク質に対しては、アミノ酸の親水性・疎水性による標準的な指標を用いた色彩パターンが、大まかな分類には有効であることが示唆された。 著者の個性を識別するという観点から、日本語文章における類似性の計量化を検討している。すでに、読点の付け方によって、著者の癖が識別できる(クラスター分析による)ことが強く示唆される結果を得た。目下、同一著者の経年変化を調査するためのデータベースを作成中であり、次年度中には、一定の成果が見込まれる。 最後に、配列の類似性の数理へ向けた研究であるが、配列の「複雑さ」「階層性」「自己組織化度」を表す特性量として、配列エントロピーに付け加えるべきものを探索中である。今後は、それらを用いた計算機シミュレーションを念頭に置いた数理を展開する予定である。
|
Research Products
(3 results)
-
[Publications] 尾畑伸明、他4名: "作者の統計的識別の一例"人文科学における数量的分析(統計数理研). 4. 51-60 (1999)
-
[Publications] 尾畑伸明、大澤研二、吉田徹彦: "A method of sequential analysis by 2D-pattern formation with coloration"Amino Acids. 17. 121-121 (1999)
-
[Publications] 尾畑伸明、大澤研二、吉田徹彦: "A method for information analysis of sequences by two-dimensional pattern formation with coloration"in"Quantum Information (T.Hida et al,eds.)". 27-58 (1999)