2009 Fiscal Year Annual Research Report
非文法的かつ断片化したテキストからの情報抽出に関する研究
Project/Area Number |
20680006
|
Research Institution | The University of Tokyo |
Principal Investigator |
荒牧 英治 The University of Tokyo, 知の構造化センター, 特任講師 (70401073)
|
Keywords | ライフサイエンス医学・医療 / ディレクトリ・情報検索 / アルゴリズム / 自然言語処理 / 機械学習 |
Research Abstract |
平成13年度に政府が発表した「保健医療分野の情報化にむけてのグランドデザイン」にて,電子カルテシステムの普及が課題の一つとして掲げられた.以降,急速に電子カルテが普及し,その結果,大量の臨床データが電子化された状態でストックされつつある.このデータを利用できれば,過去類をみない大規模な統計的な臨床研究が実現可能であり,大きな期待がよせられている.しかし,カルテ中の一部の情報は自然言語で記述されており,データをフルに利用するためには,自然言語処理技術が必須となる.このような状況から,本研究ではカルテの一種である退院サマリー(退院時に記述される患者の経過をまとめた文書)を対象とし,そこから患者情報を抽出することを目標とした. 本研究は,本年度が最終年度であり,情報抽出システムをウェブにて公開した(http://luululu.com/mednlp/).作成したコーパスに関しても一部を同ページで公開し,技術波及に務めた.
|
Research Products
(6 results)