2006 Fiscal Year Annual Research Report
大規模臨床医学用語概念オントロジーデータベースの開発手法に関する研究
Project/Area Number |
16200039
|
Research Institution | The University of Tokyo |
Principal Investigator |
大江 和彦 東京大学, 医学部附属病院, 教授 (40221121)
|
Co-Investigator(Kenkyū-buntansha) |
小野木 雄三 東京大学, 医学部附属病院, 科学技術振興特任教員 (90233593)
波多野 賢二 東京大学, 医学部附属病院, 助手 (60311619)
美代 賢吾 東京大学, 医学部附属病院, 講師 (40302690)
篠原 信夫 東京大学, 医学部附属病院, 科学技術振興特任教員 (90345223)
山口 泉 東京大学, 医学部附属病院, 助手 (80345222)
|
Keywords | オントロジー / シソーラス / 自然言語処理 / 電子カルテ / 医療情報システム / 医療用語 / 知識処理システム |
Research Abstract |
臨床医学オントロジーの大規模化を進めるため、 1.医学辞書を用いた用語間関係の自動抽出手法と用語の自動分類手法 2.テキストからの人体部位関係の抽出 また、構築されたオントロジーの将来の活用方法を検討するため、 3.診断報告書からの重要所見情報の抽出手法の検討を行った。 さらに、 4.大規模臨床医学オントロジーの構築の基盤となるデータベース構造の検討をおこなった。 1では、約7万語の医学大辞典のうちや約48000見出し語定義文を自然言語解析により用語間の上位/下位関係抽出を行い、25800個の関係が抽出された。人による評価の結果、平均精度は89%、再現率は約7%であった。 2では、研究協力者の荒牧らとともにインターネット上のリソースから、電子化された解剖学講義テキストおよび電子教科書から抽出した50000文を用い標準病名マスター修飾語でこれらのコーパスに5回以上出現した部位用語427語についてメタ関係をもとに部位関係抽出を行った。 3では、研究協力者の今井らとともに東大病院2005年6ヶ月間のCT、MRIの診断報告書22496件を対象に医学用語属性と構文情報を用いて重要所見情報の抽出実験を行い、Recall 76%、Precision 91%を得た。 4では、データベース構造として、ラペルテーブル、概念定義テーブル、クラス定義テーブル、概念関係テーブルの4テーブルで表現する手法を開発した。これにより循環器内科領域の約100概念についてこの構造でのデータベースを実装し問題点を検討した。リレーショナルテーブルでの表現は不可能ではないもの、操作するアプリケーションソフトウェアに負荷が大きく、専用のデータペースを設計することが望ましいと考えられた。
|
Research Products
(5 results)