当院は視覚障害の患者向けに情報を点字で提供する情報保障に取り組んでいる。点字翻訳での問題は、(1)同音異義語や受け身と敬語の判別が困難であり、(2)点訳時は漢字仮名混じり文よりも文字数が数倍に増加すること、である。本研究の目的は、(2)の文字数増加へ対処するため、点訳前の文章を自動変換することであり、我々が研究開発した自動点字翻訳プログラムと連携して点訳プロセスの全自動化を最終目標としている。 これまでに、前述の(1)の判別困難な単語を自動変換する規則を実装したプログラム開発に取り組んできた。本研究では、これに追加する規則を検討するため、文章要約研究の方法論を病院の医療文書に適応すべく構文解析を実施した。解析対象は、当院の外来案内と入院案内の漢字仮名混じり文から作成された、晴眼者向けの文章(原文)と人手で点訳用に簡略化した文章(点字文)の組とした。そしてこれらの文章を係受け解析ソフトCaboCha(https://taku910. github. io/cabocha/)で解析し比較した。その結果、文節の総計は外来案内の点字文は原文の約89%に、入院案内の点字文は原文の約79%に減少しており、1文中に含まれる文節数も点字文の方が平均1.5文節減少していた。文章の具体例を調べたところ、点字文では文節単位で削除される傾向が見られ、文節数減少の理由の一つと考えられた。係受け関係を持つ文節間の距離の比較では、原文と点字文のいずれも約80%が1~2文節の距離であったが、10文節以上離れている事例は原文の方が点字文より多い傾向が見られた。今後、更に解析を進めて文圧縮の有効性などを検討し、今回の結果と併せて変換規則に一般化しプログラムに実装していきたい。 なお、本研究の成果を第16回日本クリニカルパス学会学術集会で発表し、座長賞を共同受賞した。
|