遺伝子発現量は現在NCBIのGEOなどを通じて蓄積・公開が進んでいる。このデータベースの検索インタフェースは主に遺伝子やサンプルの注釈といった文字列情報である。本研究では、この検索機能強化のため、実験で採取した遺伝子発現量情報を基に類似の遺伝子発現量を示すサンプルの検索エンジンの作成を行う。類似したサンプルを検索できる事で、たとえば、類似した病状の患者が遺伝子発現という客観的な情報を基に発見できるなど、医療的にも重要な研究である。しかし、遺伝子発現量の観測は様々な環境、研究室において採取されており、観測値には様々なノイズが含まれている事が考えられる。そこで、特に遺伝子の発現量を順位に変換することで、採取環境が異なっていても同様の検索結果となるよう、検索結果のロバスト性を考慮した検索エンジンの開発を行う。平成20年度には、検索エンジンの第一段階として、遺伝子発現量を入力とし、高発現している遺伝子はどのような機能を持った遺伝子であるかを提示する遺伝子機能の検索エンジンであるGOMAを作成し、公開した。これにより、採取した遺伝子とその発現量を入力することで、細胞内で、どの様な遺伝子機能に変化が起こったかを観測することが可能となっている。更に、遺伝子発現量を入力しDBから発現量が類似したサンプルを返す検索エンジンMAREの開発を行った。しかし、研究計画時点で恐れていた通り、検索速度が出ていないので、21年度では検索精度を保ったまま速度向上の研究を行う。
|