2008 Fiscal Year Annual Research Report
Project/Area Number |
17017037
|
Research Institution | National Institute of Genetics |
Principal Investigator |
大久保 公策 National Institute of Genetics, 生命情報・DDBJ研究センター, 教授 (40233069)
|
Keywords | ゲノム / 情報工学 / マイクロアレイ / 遺伝子 / 生体生命情報学 |
Research Abstract |
用語の重み付けについて遺伝子の機能の表現を例に研究を続けた。使用する遺伝子列として前年まではマイクロアレイデータやゲノムデータにより序列化された遺伝子を使用していたが今回はより確実な検定のために「同じファミリーに属する遺伝子群がいかに機能表現を受けているか」に注目した。 すなわち個々の遺伝子の機能はフアミリーに共通な部分(generic function)とメンバー間で違う(specific function)が知られているはずであるが、前者と後者に区別してそれぞれがどの程度強く正しく表現されているかに注目し目視検定を行った。ヒト遺伝子機能を新たにEntrez Geneの参照文献の要旨の連結文およびサマリー記述に含まれるBOB辞書用語で用語ベクトル化し、25冊の平均評価書空間に投射し、各ページとの余弦パタンによってそれぞれの遺伝子機能を表現した。一方で検定を容易にするためにInterProを用いヒト遺伝子の約半数を何十にも重複を許すファミリーの組にまとめ、それぞれから前年度までに作成していたBOB教科書マップ表示へ直接移行できるインターフェイスを作成した。 そもそも遺伝子の機能記述については多くの教科書ではファミリーの存在を意識せずに書かれている場合も多く、総説でも明確な区別なくさらには別の生物由来のものも混在している。将来、両方の機能を別々に明確に表現する方法を確立することを遺伝子機能の定式表現においては一つの目標にするべきであると確信した。
|