研究概要 |
【2011年度の成果】 1. 2011年12月 昨年2010年に作成公開したComeJisyoV3(登録語数41,592語)の複合語の品詞(名詞サ変接続と名詞一般)について規則を定め、改定版ComeJisyoV3-1を公開 2. 2012年1月 登録語の拡充を行い、ComeJisyoV4(登録語数77,647語)を公開 3. 2012年3月 一般的な辞書(IPADIC)に登録される用語の中に、医療用語特有の読み方をするものが見つかったため、これらを追加登録し、2012年3月にComeJisyoV5(登録語数77,775語)を公開例:呼名(コメイ)、嫌気(ケンキ)、根性(コンセイ) 4. 電子医療記録に含まれる用語(ComeJisyo登録語)の語彙調査を行い、知見を研究会で発表。 5. 電子医療記録のタグ付きコーパス(品詞、フリガナ、ヨミガナ、利用場面等)869,712行を作成 【意義及び重要性】 標準化された用語や書式がない中、電子カルテシステムを導入する施設は増加し、日々大量の電子医療記録が蓄積されている中での、市販の専門用語辞書には含まれない業界用語や隠語、略語を含む単語分割用辞書ComeJisyoの作成・公開は、電子医療記録の単語分割の解析精度を向上させ、加えて、ComeJisyoを使って単語分割を行うことで、複数の解析結果の比較(メタ分析)を可能にした。 また、ComeJisyoには、品詞以外にヨミガナが付加されており、csv形式でも公開しているため、音声に変換することや、仮名漢字変換に活用が可能である。
|