• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

表記ゆれ及びそれに類する現象の包括的言語処理に関する研究

Research Project

Project/Area Number 23680013
Research InstitutionThe University of Tokyo

Principal Investigator

荒牧 英治  東京大学, 知の構造化センター, 特任講師 (70401073)

Project Period (FY) 2011-04-01 – 2014-03-31
Keywords言語処理 / 医療情報
Research Abstract

電子カルテの普及とともに,大量に臨床データが蓄積されつつあるが,いまだ,そのデータをフルに利用した有望な研究/医療サービスは存在しない.
本研究では言語処理技術を用い,カルテのテキスト情報中の表記ゆれを吸収する共通基盤をつくった.
また,開発した処理基盤を再利用可能なモジュールとして公開準備を進めた.
本年度は,特に(I)同義語と(II)翻字ペアに関して整備を進めた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究では扱う現象として次の5つを想定している:(I)同義語,(II)翻字ペア,(III)略語とその展開型,(IV)記号/絵文字化,(V)書き間違い.
これらの現象のうち,(I)同義語と(II)翻字ペアについて,表記揺れ吸収モジュールを構築し,Javaのクラスとして実証実験を始めた.
実験の結果,検査名などの表記揺れ吸収にて,80%以上の精度を得た.

Strategy for Future Research Activity

(III)略語とその展開型,(IV)記号/絵文字化,(V)書き間違い,など従来表記揺れの範疇とされていなかった現象について,取り組みを開始する予定である.

  • Research Products

    (1 results)

All Other

All Remarks (1 results)

  • [Remarks] 表記ゆれツール公開ページ

    • URL

      https://sites.google.com/site/mednlp/mednlp_xls

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi