2005 Fiscal Year Annual Research Report
ゲノム科学の教育推進と社会還元を目的とした日本語オントロジーの構築
Project/Area Number |
17019042
|
Research Institution | Kyoto University |
Principal Investigator |
金子 周司 京都大学, 薬学研究科, 教授 (60177516)
|
Keywords | オントロジー / シソーラス / ゲノム科学 / 電子辞書 / コーパス / 用語法 / 専門用語 |
Research Abstract |
本研究の目的は,日本語で記述された学術総説における用語の頻度および共起関係を解析したデータに基づき,医学専門用語の概念体系(オントロジー)を構築し,英日対応シソーラス(概念の上下関係を含む類義語辞書)を世に提供することである。本研究は,日本語総説誌テキストを材料とした医学日本語コーパスを構築し,抽出した専門用語について頻度解析を行って収録すべき専門用語ライブラリを制作する作業と,シソーラスの原形となる医学用語シソーラスMeSHの意味体系を参考にしつつ対訳シソーラスを完成させ,概念表記の冗長性や日本語と英語の間に生じる相違等の問題点を確認する作業に分けて行った。本年度の作業によって,英和49,000語,和英48,000語(全対訳70,000語)の日英対訳辞書を構築し,2006年1月にインターネットで無償公開した。また,この対訳辞書によって,22,000語の日英対訳シソーラスを完成させた。主な分野別内訳としては,解剖用語(MeSHカテゴリーA)2187語,生物学名(B)1615語,病名(C)5419語,生体内物質および薬物(D)5483語,方法(E)1612語である。対訳辞書をインターネットで公開したところ,1日あたり10万件の検索を受けるサイトになった。本研究で構築した対訳シソーラスは専門情報の検索において英語および日本語の自由な使用を可能にするものであり,さまざまな科学および医療情報が電子化される将来において一般社会における科学および医療への理解を進めることに寄与できると期待される。
|