2008 Fiscal Year Annual Research Report
日本語によるゲノム情報の検索と理解を助けるポータルの開発
Project/Area Number |
20018015
|
Research Institution | Kyoto University |
Principal Investigator |
金子 周司 Kyoto University, 薬学研究科, 教授 (60177516)
|
Keywords | ゲノム情報 / 情報検索 / シソーラス / 連想検索 / ポータル |
Research Abstract |
これまでに, ライフサイエンス辞書に収録された約18万語の英日対訳の専門用語をMeSH DescriptorおよびSupplemental Conceptsに準じた2.5万語の統制語に集約することで対訳シソーラスとシノニム辞書を制作し, すべての統制語について日本語化を完了した。続いて, PubMedより代表的な学術誌に過去10年間に掲載された論文抄録(600Mバイト)を収集し, シノニム辞書によってテキスト中に最長一致で統制語のタグを施した。次に, 同一抄録中で共起する統制語のペアを収集することによって合計143万対の共起頻度を求め, 出現した2万語の統制語ごとに上位30対までの共起概念データを得た。このリストを目視によって検討し, 曖昧性の排除と統制語の最適化を行い, 2万語の統制語に対して約30万語の共起概念を整理した。このようにして得た共起概念をシソーラスに関連づけることによって, 検索された日本語あるいは英語を自動的に統制語に直して表示するとともに関連性の高い共起概念を表示し, 外部リンクにより既存ポータルに検索語を渡せるデータを制作した。これらはオンライン版ライフサイエンス辞書WebLSDのサブセットとして, ある統制語に対して付与される同義語, 概念ツリー, 共起概念を一覧できるシソーラスとして公開した。その結果, 従来より公開している英和・和英およびKWIC形式での英語共起表現辞書へ新たにシソーラスが加わり, その間を相互に行き来しながら, 専門用語の階層性や同義語を調べることができる我が国はじめてのオンライン専門用語辞書が完成した。また, 共起概念を用いる連想検索によって, 特定の遺伝子や生体分子に対して関連する現象, 疾患, 医薬品, 手法, 並列概念などと併せてEntrezなどの外部データベースを絞り込み検索できるゲノム科学ポータルを構築した。
|
Research Products
(3 results)