電子カルテの普及とともに,大量に臨床データが蓄積されつつあるが,いまだ,そのデータをフルに利用した有望な研究/医療サービスは存在しない.本研究ではカルテのテキスト情報を有効利用するために必須となる材料である医療テキストを構築した.また,医療テキストを構造化された情報へ変換する技術の開発も行った. まず,臨床研修を終了した医師7名に仮想の患者を想定し,病歴報告の作成を依頼した.この結果,50文章を越える医療テキストが収集された.これらは仮想の患者であるため,個人情報に縛られることなく研究利用また配布が可能である.さらに,作成された病歴報告に対して,医療表現や,個人情報に関わる表現にタグ付けを行った.これは,医療従事者2名により3ヶ月をかけて行った.構築されたデータは国際ワークショップNTCIRの枠組みを通して,配布し,自由に研究利用可能なようにした(NTCIR MEDNLPワークショップ).また,ワークショップには,海外2チームを含む16研究チームが参加し,本データを利用した.以上のように,多くの研究グループの関心をあつめたことからも示唆されるように,本提案は医療分野において高い期待を集める課題であるだけでなく,言語処理技術の応用可能性を試すという観点で,言語処理分野においても挑戦的な課題であった. 本研究がきっかけとなったワークショープは来年度の開催も決定しており,今後のますますの発展が期待される.
|