1991 年度実績報告書

文法記述によるゲノム構造の表現方式

研究課題

研究課題/領域番号	03266203
研究機関	東京農工大学
研究代表者	小谷善行東京農工大学, 工学部, 助教授 (20111627)
キーワード	文法推論 / ゲノム構造 / アラインメント / 記号処理 / 構文解析
研究概要	本研究の目的は、文法推論のパラダイムにより自動的にゲノム構造を獲得する方式を設計することである。最初の段階では、第一にゲノム向き文法の形式を決定する。これは文法規則の形や制限として表される。同時に、一つの文法が規定する記述対象(配列の集合、すなわちパタ-ン)をどのレベルとするのかを決める。第二にサンプル記述対象に対して、この形式により実際の文法規則を作成する。さらにサンプルデ-タに対してこの文法規則により構文解析し、対象パタ-ンの検出を行う。今年度は第一にこのゲノムに文法推論を行う枠組みの設計を行った。文法推論方式は、サンプル記号列の部分列を順次非終端記号に置き換えていく方法を取る置き換えるものとしては、(1)統計的に有意に出現する小記号列、(2)複数のサンプルに出現する長い記号列、(3)複数のサンプルにおける相違部分どうし、(4)文脈同値(類似)関係を持つ記号列どうし、(5)同一文脈の内側の記号列、を検討することにした。アルゴリズムの概略は、まずサンプル記号列の集合を与える。そのなかの記号列注の部分列を、上のどれかにしたがって選び出し、それを同一の非終端記号に置き換える。そうしてできる記号列の集合に同じことを繰り返し、部分列がなくなるまで繰り返す。第二に、上の(1)の置き換えによる構造抽出(文法推論)のシステムを試作した。これを数種の同一遺伝子に対して適用した。この場合、同一アミノ酸配列をマッチングさせた形と似たものとなる。すなわちアラインメントの基本的部分と一致する。現在はまだ行っていないが、同一パタ-ンがさまざまな所にある場合もすべて同一非終端記号に置き換えられているわけで、それらはすべて認識されている。さらに、今後(2)から(5)などの異なる方式による非終端記号決定メカニズムを実現し、その機能を評価する方法を検討している。

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] 小野敬規: "アミノ酸配列の構造解析" 情報処理学会第44回全国大会講演論文集. 1-351-352 (1992)
[文献書誌] 山口昌也: "2言語の文法対応学習系の学習能力" 情報処理学会第44回全国大会講演論文集. 3-41-42 (1992)
[文献書誌] 野池覧二: "曲の構造情報から表情付けを行う自動演奏" 情報処理学会第44回全国大会講演論文集. 1-403-404 (1992)