2014 Fiscal Year Annual Research Report
Project/Area Number |
24700132
|
Research Institution | The University of Tokyo |
Principal Investigator |
篠原 恵美子(山田恵美子) 東京大学, 医学部附属病院, 助教 (40582755)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 用語 / 知識 / 自然言語処理 / 言語学 / 情報抽出 / 医療情報学 |
Outline of Annual Research Achievements |
病院情報システムの普及とともに診療テキストが電子的に蓄積されつつあり、その利活用のためには記述されている情報がどこの身体部位についてのものであるかを特定することが必要である。身体部位を表す用語集は解剖学の専門家により編纂されているが、診療テキストで使われる身体部位表現は様々なバリエーションがあるため、そのような用語集ではカバーしきれない。本研究ではこのギャップを埋めることを目指し、上述の用語集を基盤としてテキスト中の身体部位表現を抽出し、さらにその表現が指し示す実際の身体部位を特定する技術の研究・開発を行った。
本年度は昨年度行った分析結果に基づき、身体部位表現の内部構造モデルを構築した。このモデルは、1) 要素語、2) 要素語の分類体系、3) 要素語の合成規則、4) 辞書から構成される。このモデルによって、これまで扱うことが難しかった「胸椎+腰椎=胸腰椎」のような縮退を表現することができ、また表層文字列のみならず要素語間の関係も表現されるため修飾語の付加による意味変化に対して頑健な処理の実現が可能である。
|
Research Products
(3 results)