2013 Fiscal Year Research-status Report
Project/Area Number |
24700132
|
Research Institution | The University of Tokyo |
Principal Investigator |
篠原 恵美子 (山田 恵美子) 東京大学, 医学(系)研究科(研究院), 助教 (40582755)
|
Keywords | 用語 / 正規化 / 医療情報 |
Research Abstract |
国内の医療機関では電子カルテなどの導入が進みつつあり、診療情報がコンピュータで処理しやすい形式として蓄積されている。このような情報を医療者の診療業務や臨床研究を支援するために活用することが期待されているが、人間の言葉で書かれた情報は同じことを表すのにも違った表現をすることがあるので、そのままでは活用できない。本研究は診療情報の中でも基本的な情報である身体部位に焦点を当てて、この問題の解決を目指している。 本年度は、身体部位の表現の基本である解剖学用語の分析結果に基いて、表現がどのように組み立てられているのかを表すモデルを構築した。モデル構築にあたっては、日本語の言葉一般について言語学分野で蓄積されている知見を取り入れた。この知見に加え、医学医療分野特有の言葉の使い方を表現できるように、解剖学用語の構成要素として使われる語の分類や、それをどのように組み立てるのかの規則を作り、実際に解剖学用語を組み立てられるかどうか実験を行った。その結果、自動的な組み立てがほぼできることがわかった(現在論文投稿中)。 また、このモデルは身体部位のためのものだが、拡張することで病名や手術名などにも適用できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は正規化処理のための核となる内部構造モデルの構築を行い、基本モデルの策定が完了した。本モデルによりテキストからの身体部位情報の抽出と内部構造解析の両方が実現可能である。またこのモデルに基づいた内部構造解析アルゴリズムの開発を行った。本研究の目的は、この内部構造を用いた部位表現の正規化技術の構築であり、次年度中に完了する予定である。
|
Strategy for Future Research Activity |
次年度は、1) 部位表現の内部構造に基づいた正規化アルゴリズムの実装、2) 内部構造解析に必要な知識リソースの整備、3) 正規化アルゴリズムの評価実験を行う。 正規化アルゴリズムは内部構造に要素として含まれる解剖学用語を核として、部位表現を任意個数の修飾語付き解剖学用語に分割するものである。既に内部構造が解析できるようになっているため、実装は上半期に完了する見込みである。 知識リソースは部位表現の要素となる最小単位の辞書と、解剖学用語の辞書が必要である。共に語のみでなく分類等の属性情報も含むものである。本年度行った実験では実験データを解析可能な範囲でこれを構築しており、次年度は解剖学用語全体を解析可能となる範囲まで広げる。さらに解剖学用語には含まれない要素語も存在しており、これについては教科書や症例報告から可能な範囲で収集する。リソース構築も上半期に完了する見込みである。 以上2つを用いることで部位表現の正規化が現実的に可能となる。最後に、正規化の評価を行う。評価対象としては、教科書および症例報告に現れる部位表現を想定している。必要に応じて実際の診療録で用いられた部位表現も対象とする。
|
Expenditure Plans for the Next FY Research Funding |
本年度は対象範囲とする解剖学用語を少数に絞って研究を行ったことから、必要となる作業量が少なかったため。 次年度は対象範囲を広げるため、解剖学用語集を解析用の形式に変換すること、教科書等から部位関連語を収集する作業に充てる。
|