2012 Fiscal Year Research-status Report
診療チーム意思決定のバスケット分析とAPMLを用いた道筋解析と行動予測
Project/Area Number |
23590629
|
Research Institution | Kansai Medical University |
Principal Investigator |
渡辺 淳 関西医科大学, 医学部, 准教授 (40148557)
|
Keywords | 意志決定 / 行動予測 / 道筋解析 / バスケット分析 / 診療記録 / 暗黙知 / 形式知 / 自然文解析 |
Research Abstract |
1) 少量の(偽造された)SMTPエンベロープ情報から419 scam(詐欺メール)送信者の送信方略等に関する意図およびその後の展開予測のためのアルゴリズムを構築し、大手フリーメールのサーバから送信される419scamを対象として実証実験を行った。送信者の送信方略に関する意図を顕在化させるステップをアルゴリズムに組み込んだうえでエンベロープ情報をバスケット分析とベイズ推定を用いて解析することによって、419scamの高効率の検出と阻止(現時点における感度90%、特異度98%)が可能となるとともに、少量データを用いた意思決定の道筋解析と展開予測に際し、暗黙知を顕在化して形式知とすることの重要性が示された。 2) 同病名が付与された患者の電子カルテのアセスメントおよびplanの記載(日本語、自然文)を抽出し、個人情報を除去した後に解析用サーバに移出して、まず、MeCabを用いた形態素解析、次にCocke-Younger-Kasami (CYK法)を用いた構文木解析および係り受け解析(CaboCha, 辞書にはmecab-jumandicを利用)を実施するとともに、GNU Rを用いて因子分析、多重対応分析、バスケット(アソシエーション)分析およびベイズ推定を行って記載者の治療指針・アウトカムの推定を試みた。また、推定結果をオーダ発行歴を含むプラン記載と比較して推定の精度を調べるとともに、推定結果に影響を及ぼす要因を洗い出した。精度は80%強と日本語自然文解析としては良好であったが、医療従事者・診療チームの暗黙知が診療記録に記載されない、クリニカルパス適用症例ではパスの内容を補充する必要がある、記載量の多寡によって推定精度が大きく影響されること等に加え、自然文処理の方法、および同義語・同義フレーズ記載対応のためのシソーラス整備の必要性が明らかとなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
1) 23,24年度の研究成果、特に上述の詐欺メール検出を対象とした「展開予測のプロスペクティブ解析」によって、当初予定していた意思決定の道筋を解析するためのアルゴリズムの概要(基本部分)がほぼ固まり、実証試験で高い予測精度が得られることを示した。ただ、実証実験の結果から、APMLよりもバスケット(アソシエーション)分析の方が暗黙知を顕在化して処理に組み込みやすいことが判明したため、24年度よりAPMLとバスケット分析の主従を逆転させた。その結果、誤検出(偽陽性)が減少したことで、このアルゴリズムを用いた詐欺メールフィルタを実用に供することが可能となり、大手フリーメール業者に対し根拠を明示して判定結果を通知(bounce messageで送信サーバに通知)することも、また実現できた。 2) 診療録の解析では、まだ、解析例数が予定の50%程度であるにもかかわらず、暗黙知の顕在化による推定精度の著しい向上が観察され、当初予測していた推定精度 (80%)にほぼ到達できたことから、本研究の方向性が間違っていなかったことが判明したことは大きな収穫であった。 3) 当初の計画では、日本語自然文で記載された診療録の意味解析にはセマンティクスと定型語句変換技法を援用して対応する予定であった。しかしながら、実際に解析を進めてゆく過程で、他の研究成果を援用して対応する予定であったそれらの意味解析(特に日本語医療記述の意味解析)法が期待していたレベルに到達していないことが判明し、調書記載の「他の研究成果を援用」が困難であることが明らかとなった。そのため、日本語自然文の形態素解析、構文木解析、係り受け解析を組み合わせて実施する機構を自力で開発する必要が生じた。まだプロトタイプの段階ではあるが、上述の診療録解析での推定精度向上には、この機構の寄与も小さくないと推定される。
|
Strategy for Future Research Activity |
研究遂行の過程で、日本語医療記述の意味解析に重要となるセマンティクス技法について、既存の手法では本研究のレベルに対応困難であることが明らかとなりつつある。試行錯誤の結果、現時点では日本語自然文の形態素解析、構文木解析、係り受け解析を組み合わせた解析を導入してこの問題に対応しているが、今後はシステマティックな解析を行って、日本語自然文による医療記述の適切な処理方法を確立してゆく必要があると考えられる。 他方、隠蔽情報(暗黙知)の顕在化を取入れたことで行動予測の精度は予定した値に達しつつあるものの、その精度は、基本的に、解析対象である医療記述の処理如何で左右されると推定される。 幸い、推定のためのアルゴリズムが予定より早く構築でき、実証試験で得られた予測の精度も所期の値に達しつつある。そこで、最終年度である平成25年度については、当初の予定に加えて日本語自然文を用いた医療記述の処理手法を中心に研究を進める計画である。 具体的には、まず、現時点で実施している形態素解析、構文木解析、係り受け解析を組み合わせた手法について、実際の解析結果にもとづいて問題点を洗い出し、改善を進める。さらに、記載者のアウトカム推定および行為解析手法としてConvincing Human Action Rationalized Model (CHARM)を組み合わせ、記述に基づいた下流(行為)から上流(意図)に向けたボトムアップ解析を基本とした、日本語自然文を用いた医療行為記述の精度の高い解析に必要な方策を検討する。 なお、この試みは医療データをはじめとする「ビッグデータ」の解析、特に医療分野にあっては電子カルテ等に記載された自然文の解析に不可欠な手法であると推測される。
|
Expenditure Plans for the Next FY Research Funding |
学会での成果発表(3泊4日1回 50,000)および論文投稿費用40,000円を除く残額はすべて消耗品費に用いる。 消耗品として、自然文解析プログラム開発用マイクロサーバ(OpenBlocks A7)、NAS(データストレージ TS-RX2相当品)、ケーブル類(Serial USB変換アダプタケーブル等)を予定している。
|
Research Products
(4 results)