• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

生命科学辞書とオントロジーの自動構築法の開発

研究課題

研究課題/領域番号 17017037
研究機関国立遺伝学研究所

研究代表者

大久保 公策  国立遺伝学研究所, 生命情報・DDBJ研究センター, 教授 (40233069)

キーワードゲノム / 情報工学 / マイクロアレイ / 遺伝子 / 生体生命情報学
研究概要

課題として(1)遺伝子発現データの統合および(2)マイクロアレイデータの自動解釈(3)PubMed abstractの自動分類の3つを平行して行っている。
(1)解剖名称自動分類機によって動物種をまたいだ遺伝子発現データの統合はほぼ完成した。特に自動分類で一番問題になる「正当性の表現」をKIWIC表示によって分類のプロセスをトラックバックできるようにすることで乗り越えることができた。
(2)教科書から作成した用語のリストおよび相互の関係を余弦で表現した用語ベクトル集合(構造化用語)を使って、遺伝子の機能解説をこのベクトル集合が張る空間(教科書空間)のひとつのベクトルとして表現することで遺伝子相互の関係や遺伝子と用語の関係が直感的に正しく表現できることは証明できた。さらに空間の遺伝子機能の表現として教科書の章立てに対する余弦プロフィールは雄弁であることが確認できた。一方で遺伝子機能の言語表現として利用した分子データベースのサイテーションの内容が意味のない繰り返しや無関係な話題が多く全体の感度精度に大きく影響していることがわかった。ベクトル化に際してのいわゆるローカルファクターやグローバルファクターのチューニングだけで乗り切れる課題ではないかもしれない。いったい人間はこのサイテーションからどのように遺伝子機能を理解しているのかについての再考が必要かもしれない。
(3)PubMed Abstractの内容も教科書から作成した構造化用語をマップすることで、それらの重みつきのベクトルの和として表現可能であることを確認した。

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi