2012 Fiscal Year Annual Research Report
Project/Area Number |
22650025
|
Research Institution | The University of Tokyo |
Principal Investigator |
荒牧 英治 東京大学, 知の構造化センター, 特任講師 (70401073)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 言語処理 / 医療情報 / 情報検索 |
Research Abstract |
電子カルテの普及とともに,大量に臨床データが蓄積されつつあるが,いまだ,そのデータをフルに利用した有望な研究/医療サービスは存在しない.本研究ではカルテのテキスト情報を有効利用するために必須となる材料である医療テキストを構築した.また,医療テキストを構造化された情報へ変換する技術の開発も行った. まず,臨床研修を終了した医師7名に仮想の患者を想定し,病歴報告の作成を依頼した.この結果,50文章を越える医療テキストが収集された.これらは仮想の患者であるため,個人情報に縛られることなく研究利用また配布が可能である.さらに,作成された病歴報告に対して,医療表現や,個人情報に関わる表現にタグ付けを行った.これは,医療従事者2名により3ヶ月をかけて行った.構築されたデータは国際ワークショップNTCIRの枠組みを通して,配布し,自由に研究利用可能なようにした(NTCIR MEDNLPワークショップ).また,ワークショップには,海外2チームを含む16研究チームが参加し,本データを利用した.以上のように,多くの研究グループの関心をあつめたことからも示唆されるように,本提案は医療分野において高い期待を集める課題であるだけでなく,言語処理技術の応用可能性を試すという観点で,言語処理分野においても挑戦的な課題であった. 本研究がきっかけとなったワークショープは来年度の開催も決定しており,今後のますますの発展が期待される.
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|