研究課題/領域番号 |
26610037
|
研究機関 | 京都大学 |
研究代表者 |
小谷野 仁 京都大学, 医学(系)研究科(研究院), 助教 (10570989)
|
研究分担者 |
林田 守広 京都大学, 化学研究所, 助教 (40402929)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 文字列 / 確率論 / 統計学 / 機械学習 / 生物配列 / バイオインフォマティクス |
研究実績の概要 |
昨年度は、2014 年度に得た文字列の非可換位相半群 A* 上の確率論における結果とそれに基づいて構築した文字列データを教師付きの仕方で識別する学習機械の理論を応用して、塩基配列を用いた RNA の 2 次構造の予測及びアミノ酸配列を用いたタンパク質間相互作用の予測の研究を行った。また、A* 上で混合モデルと EM アルゴリズムの理論を展開することにより、文字列データを教師なしの仕方で分類する統計理論を構築した。これらの研究の結果を次の 3 本の論文にまとめた (3 本目は査読中)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本研究プロジェクトは、[1] 文字列の非可換位相半群 A* 上で確率論を整備する、[2] [1] の結果に基づいて、文字列データを教師付きの仕方で識別する学習機械の理論を構築する、[3] [1] の結果に基づいて文字列データを教師なしの仕方で分類する統計理論を構築する、[4] [2] の方法を応用して、アミノ酸配列を用いたタンパク質間相互作用の予測と塩基配列を用いた RNA の 2 次構造の予測の研究を行う、[5] [3] の方法を応用して、16S リボソーム RNA 遺伝子配列を用いた gamma 多様性の測定の研究を行う、という 5 つの部分からなっているが、2014 年度と昨年度までで [1] から [4] までが終わっているため。
|
今後の研究の推進方策 |
本研究プロジェクトの最終年度である本年度は、上の【現在までの進捗状況】において述べた本プロジェクトの最後の部分である [5] の研究を行う。現在、林田が京都大学化学研究所の KEGG データベースのデータの前処理を行っており、小谷野のデータ解析のためのプログラムを作成している。また、最後に 3 年間の研究の総括を行う。
|
次年度使用額が生じた理由 |
昨年度投稿した論文の出版費用として計上していたが、現在査読中であり、出版に至らなかったため。
|
次年度使用額の使用計画 |
今年度、論文の出版費として使用する予定である。
|