これまで、看護ケアデータ分析システムにおいてさらなる分類性能向上を目指してきた。平成23年度に遺伝的アルゴリズムを用いた特徴抽出システムを導入した。この導入により看護の専門家が対象テキストを評価する際に着目しているであろうと考えられる単語を自動抽出することができ、これを提示することで評価根拠の可視化を行うことができる。この方法で提示できるのは単語(または単語群)であるため、提示結果の理解はそれほど容易ではなかった。平成24年度は、単語の集合で評価結果の根拠を示すのではなく、単語の木構造で評価結果を提示するシステムを開発した。本年度開発した方法では、多くの看護ケアテキストを分類することに貢献した単語から順に木構造で評価根拠を表現する。これにより、従来の単語集合のみで提示するシステムよりも内容の理解が容易になった。 また、対象テキスト集合は質問内容に応じて複数あるが、主に単語に着目して分類可能なテキスト集合と、内容(テキストとして未記述で行間に暗に含まれている内容、を含む)に着目して分類しなければならないテキスト集合が存在している。そこで、平成24年度は文章の係り受け構造を特徴ベクトルとして表現する手法を開発し、看護ケアデータ分析システムに導入した。これにより、前述のような性質を持つテキスト集合の分類性能は向上した。また、係り受け構造を特徴ベクトル化したことにより評価根拠可視化の際の木構造がより人間に理解しやすいものとなった。 一方で、係り受け構造を表現した特徴ベクトルに対する遺伝的アルゴリズムに基づく特徴抽出システムの開発が新たに必要となった。すなわち、従来の二値表現の特徴ベクトルから実数値表現の特徴ベクトルに拡張し、さらに、重要な係り受け構造が破壊されないような遺伝的操作の設計が必要である。今後は前述のように明らかになった点を含めたさらなる拡張を行う予定である。
|