研究課題
個々の生物種におけるタンパク質ドメインの進化的構成を解析するため,現在までに突然変異および遺伝子重複に基づく文法圧縮による手法を開発し,7つの生物種に対して提案手法を適用していた.当該年度においては生物種の数を増やし,UniProtデータベースに含まれる生物種のうち,真核生物73種,細菌328種,古細菌14種にそれぞれ適用した.その結果,細菌,古細菌では大きく圧縮されたものはほとんどなく,真核生物ではばらつきがあり近縁種であっても圧縮率に違いが出た.今後の研究において詳細に検討する.タンパク質アミノ酸配列または核酸塩基配列において,ある特定の機能を示す部分配列を確率モデル化する手法に関する研究を論文にまとめた.まず文字列の集合上にラプラス様確率分布を定義した.中心となる文字列がパラメータとして与えられ,この文字列との距離が大きくなる程,確率が小さくなるとした.このとき,ある特定の文字列の集合が与えられたもとで,これらを生起させるラプラス様混合確率分布をEM(期待値最大化)アルゴリズムを使って推定する手法を開発した.Rfamデータベースから取得した6つの配列ファミリー,計289本のRNAに混合数を6として提案手法を適用し6つの中心となる文字列を推定するとともに有効性を確認した.この他にタンパク質相互作用ネットワークと遺伝子発現プロファイルを統合し畳み込みニューラルネットワークを利用して肺がんを予測する手法に関する研究を論文にまとめた.
すべて 2019
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件)
Journal of Computer and System Sciences
巻: 106 ページ: 94~128
10.1016/j.jcss.2019.07.003
Journal of Bioinformatics and Computational Biology
巻: 17 ページ: 1940007~1940007
10.1142/S0219720019400079