2010 Fiscal Year Annual Research Report
Project/Area Number |
22650025
|
Research Institution | The University of Tokyo |
Principal Investigator |
荒牧 英治 東京大学, 知の構造化センター, 特任講師 (70401073)
|
Keywords | 言語処理 / 医療情報 / テキストマイニング / 知識処理 |
Research Abstract |
電子カルテの普及とともに,大量に臨床データが積されつつあるが,いまだ,そのデータをフルに利用した有望な研究/医療サービスは存在しない.本研究では言語処理技術を用い,(1)カルテのテキスト情報を構造化された情報へ変換する技術を研究/開発し,(2)その技術で臨床現場をサポートするシステムを構築/実証実験を行った.カルテ文章は個人情報の塊ともいえる文章であり,研究利用が困難である.したがって,まず,ダミーのカルテデータを構築した(phase-1).これは医師に仮想患者を想定しもらい,行った.次にデータのアノテーションを行い(phase-2),これを自動化する言語処理技術を研究開発を行った.研究対象となる技術は,固有表現特定/表記ゆれ吸収/モダリティ解析といった基礎研究に分解可能で,学術的意義と社会的重要性の両方に貢献可能なよう配慮した.最後に,開発した技術を用いたアプリケーションを実装し,実証実験を行った.これは,検査名の自動対応,糖尿病臨床試験での患者コメントの分類など複数の実装により検証し,実際に運用可能であるとの評価を得た.
|
-
-
-
-
-
-
[Presentation] Adverse-Effect Relations Extraction from Massive Clinical Records2010
Author(s)
Yasuhide Miura, Eiji Aramaki, Tomoko Ohkuma, Masatsugu Tonoike, Daigo Sugihara, Hiroshi Masuichi, Kazuhiko Ohe
Organizer
COLING 2010 Workshop (In cooperation with Info-plosion) The Second International Workshop on NLP Challenges in the Information Explosion Era (NLPIX2010)
Place of Presentation
Beijing, China
Year and Date
2010-06-21
-