2005 Fiscal Year Annual Research Report
大規模臨床医学用語概念オントロジーデータベースの開発手法に関する研究
Project/Area Number |
16200039
|
Research Institution | The University of Tokyo |
Principal Investigator |
大江 和彦 東京大学, 医学部附属病院, 教授 (40221121)
|
Co-Investigator(Kenkyū-buntansha) |
小野木 雄三 東京大学, 医学部附属病院, 科学技術振興特任教員 (90233593)
波多野 賢二 東京大学, 医学部附属病院, 助手 (60311619)
美代 賢吾 東京大学, 医学部附属病院, 講師 (40302690)
篠原 信夫 東京大学, 医学部附属病院, 科学技術振興特任教員 (90345223)
山口 泉 東京大学, 医学部附属病院, 助手 (80345222)
|
Keywords | オントロジー / シソーラス / 自然言語処理 / 電子カルテ / 医療情報システム / 医学用語 / 知識処理システム |
Research Abstract |
オントロジーを人手で構築、メンテナンスを行うのは困難であり、自然言語処理を用いた構築支援手法の確立することが今年度の目的である。 1.本研究では、まず、電子内科教科書を用い、画像診断における「疾患と、それに関係する所見」との対応を抽出する手法を考案した。まず、教科書中の画像診断に関する解説文に対し、用語間の係り受け依存木を抽出する。次に、各文節内の自立語に対して医学的な属性を付与し、画像診断の所見情報を構成する部分木を全て抽出する。最後に教科書の見出し語となっている各疾患名に対し、画像診断において関係する所見を「肯定的/否定的」の別を伴い、部分木から抽出する。実験の結果124個の疾患名に対して関係する所見794個が抽出できた。また、抽出精度の評価実験により再現率66%,適合率95%を得た。今後同様の手法を専門分野教科書に適用することで、さらなる効率的な関係抽出を行える可能性が示唆された。 2.つぎに医学辞書から臨床医学オントロジーの基本的な骨組みとなる用語の関係と分類を推定する手法を考案した。まず、辞書の定義文や解説文章中の手がかりとなる表現を構造的に捉えて用語間の上位/下位関係を抽出する。次に、用語と共起する動詞表現に着目して用語の分類を行う。それぞれの手法が医療分野のテキストに適応されるのは初めてであり、両手法を組み合わせて、高精度に用語分類を行う手法の考案した。実験の結果,関係の抽出においては精度89%,分類において精度71%を得た。 3.最後に、既存の医学用語集から解剖学用語および部位に関する名称用語を約3000語収集し、これを人手で階層化する作業を行い、これを部位・解剖関係オントロジーの最初のシード材料として使用することを行った。
|
Research Products
(6 results)