研究概要 |
本研究では近年実験結果の蓄積と公開が進む遺伝子発現量情報を利用した検索エンジンの構築に関した研究を行った,第一に遺伝子の機能注釈情報である遺伝子オントロジーを利用した検索エンジンの構築を行った.これにより,遺伝子発現量集合を入力する事で,関連した機能を抽出する事が可能となった.また,検索結果は複雑なDAG構造を持ったグラフ構造で表されるため,検索結果のユーザへの提示が問題となるため,交差の少なくなるように部分グラフの切り出しと配置を行い図示する手法を提案した.次に,遺伝子発現量自身を検索するため,遺伝子発現量集合自身を入力とし,類似のサンプルを検索する検索エンジンを構築した.まず酵母遺伝子を利用した検索エンジンを作成し,類似の注釈を持ったサンプルを検索できる事を確認し,良好に動作する事が分かった.次に,本手法をほ乳類の大規模データベースに適用したところ,検索精度は良好ながら検索速度に大きな問題が生じる事が分かったため,理論的な上限を求める事が可能なランダムプロジェクションを用いた次元削減手法を導入し,高速化を計った.これにより高速化は達成された一方で,遺伝子発現データの持つゆらぎは理論で想定している上限より大きかったため,精度が悪くなる問題が起き,削減する次元数と速度の問題が浮き彫りになった。この問題を解決するため,近傍グラフと高次元インデックスを用いた検索の高速化手法を提案し,精度と速度の両立を達成することができた.
|