2005 Fiscal Year Annual Research Report
Project/Area Number |
17017037
|
Research Institution | National Institute of Genetics |
Principal Investigator |
大久保 公策 国立遺伝学研究所, 生命情報・DDBJ研究センター, 教授 (40233069)
|
Keywords | ゲノム / 情報工学 / マイクロアレイ / 遺伝子 / 生体生命情報学 |
Research Abstract |
課題として(1)遺伝子発現データの統合および(2)マイクロアレイデータの自動解釈(3)PubMed abstractの自動分類の3つを平行して行っている。 (1)解剖名称自動分類機によって動物種をまたいだ遺伝子発現データの統合はほぼ完成した。特に自動分類で一番問題になる「正当性の表現」をKIWIC表示によって分類のプロセスをトラックバックできるようにすることで乗り越えることができた。 (2)教科書から作成した用語のリストおよび相互の関係を余弦で表現した用語ベクトル集合(構造化用語)を使って、遺伝子の機能解説をこのベクトル集合が張る空間(教科書空間)のひとつのベクトルとして表現することで遺伝子相互の関係や遺伝子と用語の関係が直感的に正しく表現できることは証明できた。さらに空間の遺伝子機能の表現として教科書の章立てに対する余弦プロフィールは雄弁であることが確認できた。一方で遺伝子機能の言語表現として利用した分子データベースのサイテーションの内容が意味のない繰り返しや無関係な話題が多く全体の感度精度に大きく影響していることがわかった。ベクトル化に際してのいわゆるローカルファクターやグローバルファクターのチューニングだけで乗り切れる課題ではないかもしれない。いったい人間はこのサイテーションからどのように遺伝子機能を理解しているのかについての再考が必要かもしれない。 (3)PubMed Abstractの内容も教科書から作成した構造化用語をマップすることで、それらの重みつきのベクトルの和として表現可能であることを確認した。
|
Research Products
(8 results)