2012 Fiscal Year Annual Research Report
表記ゆれ及びそれに類する現象の包括的言語処理に関する研究
Project/Area Number |
23680013
|
Research Institution | The University of Tokyo |
Principal Investigator |
荒牧 英治 東京大学, 知の構造化センター, 特任講師 (70401073)
|
Project Period (FY) |
2011-04-01 – 2014-03-31
|
Keywords | 言語処理 / 医療情報 |
Research Abstract |
電子カルテの普及とともに,大量に臨床データが蓄積されつつあるが,いまだ,そのデータをフルに利用した有望な研究/医療サービスは存在しない. 本研究では言語処理技術を用い,カルテのテキスト情報中の表記ゆれを吸収する共通基盤をつくった. また,開発した処理基盤を再利用可能なモジュールとして公開準備を進めた. 本年度は,特に(I)同義語と(II)翻字ペアに関して整備を進めた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では扱う現象として次の5つを想定している:(I)同義語,(II)翻字ペア,(III)略語とその展開型,(IV)記号/絵文字化,(V)書き間違い. これらの現象のうち,(I)同義語と(II)翻字ペアについて,表記揺れ吸収モジュールを構築し,Javaのクラスとして実証実験を始めた. 実験の結果,検査名などの表記揺れ吸収にて,80%以上の精度を得た.
|
Strategy for Future Research Activity |
(III)略語とその展開型,(IV)記号/絵文字化,(V)書き間違い,など従来表記揺れの範疇とされていなかった現象について,取り組みを開始する予定である.
|
Research Products
(1 results)