2004 Fiscal Year Annual Research Report
Project/Area Number |
12204006
|
Research Institution | National Institute of Genetics |
Principal Investigator |
大久保 公策 国立遺伝学研究所, 生命情報・DDBJ研究センター, 教授 (40233069)
|
Keywords | ゲノム / 情報工学 / マイクロアレイ / 遺伝子 / 生体生命情報学 |
Research Abstract |
(1)遺伝子発現データ取得・統合:ヒト遺伝子発現の問題はデータが過剰である一方信頼にたる参照データが不在であることである。解剖学的な遺伝子発現についてはあらゆる遺伝子に信頼にたるデータを付与することを目標に研究を行った。 (1)基礎遺伝子発現データ:遺伝子単位にマイクロアレイ・SAGE・dbEST・BodyMapなど公的遺伝子発現データ、および本研究にて測定したiAFLP正常解剖発現データを統合し、複数のプラットフォームの発現データを比較可能なヒト遺伝子情報データベースH-ANGELを公開した。(http://www.jbrc.aist.go.jp/hinv/h-angel/wge_top.cgi?) (2)これまでに論文で発表されたハウスキーパー遺伝子セットを比較し、再解析によりその食い違いを是正し、約3倍にあたる5500のハウスキーパーを選択した。これらのセットに対し正負のコントロール遺伝子を使ってその感度と選択性を算出し、さらにCpGアイランドの有無によってその選択性を検出した。 (3)疾患サンプル遺伝子発現データ:課題疾患(糖尿病、高血圧、アレルギー)に対しては統計学的に意味のある量の生物学的に質のあるサンプルは不可能であった。入手が可能であったヒト皮膚疾患について小規模な測定解析疾患関連遺伝子の単離を行うにとどまった。 (2)データ解釈系:発現データ解析の最大の問題は次々生産されるデータを十分にしかも均質に解釈する方法がないことである。遺伝子機能の相互関係を自由な観点で測定できる環境を構築することを目標に研究を行った。 (1)医学知識のエンコードシステム:教科書のインデックスを単語×ページ行列に変換するモジュールを完成し30冊の教科書のインデックスデータをもとに40kx40k程度の行列を得た。 (2)単語xページ行列をもとにLSA法に従って単語およびページを同じ100次元の空間座標としてあらわす仕組みを完成した。 (3)ヒト遺伝子のセットRefSeqの文献データをもとに遺伝子を単語ベクトルとしてあらわし、そのベクトルを教科書の100次元空間にマップする仕組みを完成した。
|