2001 Fiscal Year Annual Research Report
放射線診断領域における医学用語シソーラスと意味ネットワークの構築
Project/Area Number |
13670920
|
Research Institution | The University of Tokyo |
Principal Investigator |
小野木 雄三 東京大学, 医学部・附属病院, 助教授 (90233593)
|
Keywords | 形態素解析 / 自然言語処理 / 放射線読影報告書 / 意味解析 / シソーラス |
Research Abstract |
概念構築の初期材料として、医字中央雑誌刊行会が作成した「医学用語シソーラス」中のMeSH医学概念に対応する日本語医学用語、およびICD-10の日本語訳とも言える「日本語標準病名集」を利用した。これらの用語集から得られる語彙は、すべて名詞のみである。 次に、現実に利用されている語彙を収集するために、既存の放射線読影報告書システムに蓄積されたレポート文章(自然言語)を利用した。このレポート文章は、東京大学医学部附属病院放射線部で過去7年間に蓄積された診断報告書のテキストから、脳神経領域を対象とするものを選別したものである。この自然言語で記述された文章からは、名詞だけでなく、形容詞や動詞など、概念を記述するために必要な語彙が得られることが期待されたほか、放射線診断における定型的な言い回しを抽出することも期待された。 以上のリソースから、概念を記述する用語として、名詞、形容詞、動詞など、品詞別に語彙を抽出した。抽出する際には日本語形態素解析処理を行うchasenを利用したが、抽出した語彙を形態素解析辞書に繰り返し登録することによって、漸近的に抽出処理を行った。 次に、抽出した各語彙に対して、読影報告書を構成する要素としての意味を付与した。これらは現時点では「疾患名」「症状」「解剖学名称」「検査方法」「治療手技」「薬剤名称」「大きさ」「位置関係」「形態」「性状」「日時」「数字」「放射線所見」である。動詞については既存辞書が利用できないため、同義語の整理と意味付与を行った。すなわち「AにBが存在する」「Aが時間的に変化してBになる」「AがBに影響を及ぼす」「AはBを支持する」の3種類の意味的属性を現時点では持たせている。以上の成果を医療情報学会において報告した。 今後はこうして作成した「意味辞書」を使ってシソーラスとしての構造を記述し、自然言語で記述された報告書から概念を抽出する計画である。
|
Research Products
(1 results)