研究課題/領域番号 |
23792550
|
研究機関 | 兵庫県立大学 |
研究代表者 |
新居 学 兵庫県立大学, 工学研究科, 助教 (80336833)
|
研究期間 (年度) |
2011-04-28 – 2013-03-31
|
キーワード | 看護ケア / テキスト分類 / 遺伝的アルゴリズム / ファジィ |
研究概要 |
看護ケアデータ分析システムにおけるテキスト分類性能向上のため、遺伝的アルゴリズムを用いた特徴抽出システムを開発し導入した。本研究のテキスト分類システムは、看護の専門家によりあらかじめ評価された過去のデータを学習用データとして学習し未知のテキストについて分類する。このとき、対象となるテキストのいずれの語に着目しているかを自動抽出するため、遺伝的アルゴリズムに基づいた組合せ最適化を利用したシステムを開発した。これにより分類性能が高くなる特徴(すなわちテキスト中の「語」)を抽出することができるようになった。これらの研究成果は、専門家によるリコメンデーション作成支援や評価結果の根拠の確認へ利用することができる。特に評価結果の根拠を示すことは、ブラックボックス型の分類システムと専門家等の人間が協調する必要のあるシステムには重要なことである。また、評価結果の根拠はリコメンデーション作成支援へ利用できる。本年度の成果では、これらの基礎データとなる「テキスト分類に寄与の大きかった複数の語およびその組合せ」をおおむね抽出できている。これは、看護ケアデータ分析システムのテキスト分類システムにおいて非常に重要な要素である。また、概念ファジィ集合による分類に使用できる語の拡張を行い、分類性能向上への道筋をつけた。テキスト分類システムにおいて語の拡張は重要であるが、これを可能な限り自動で行えるようにならなければ、構築したシステムを使用し続ける際に人件費等の大きなコストを必要とすることになる。Webの情報を利用して自動的に類似する語を発見する手法および過去の看護ケアテキストから概念集合を構築する手法を導入したことにより、未知の語が出現してもそれを自動的に既知の語と関連づけられるため、情報不足のために分類できないテキストを減少できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
看護ケアテキストを高精度で評価するための手法として、遺伝的アルゴリズムによる特徴抽出、概念ファジィ集合の構築、Web上の情報を利用した未知語と既知語の関連づけ手法の提案、開発、洗練を行ってきた。これらの手法が分類性能向上に対して有効であることを確認している。複数種類あるすべてのデータ集合に対して有効ではなかったがこれは予想された結果で、対象データの分析および手法の更なる洗練により対応可能と考えている。また、研究成果である特徴抽出により抽出された語は評価根拠の提示およびリコメンデーション作成支援の際、専門家に提示する情報の基礎となるものである。よって、研究目的および実施計画にしたがって進んでいるため、おおむね順調に計画が進展していると考える。
|
今後の研究の推進方策 |
特徴抽出手法により抽出された語をベースに、看護ケア専門家へ提示する情報として何が適しているのかを調査、研究し、評価根拠を可視化するアプリケーションを開発する。これまでの研究により、特徴抽出手法は大きな計算資源を使用する必要があることがわかったので、並列計算等の可能な計算機システムの充実が必要である。また、これまでは「語」に着目してテキスト分類システムを考えてきたが、さらなる性能向上のためには語と語の関連や、文章構造にも着目する必要があるため、これらのことを視野に入れた拡張を行う。すなわち、テキスト分類の際の特徴をこれまでの語ベースのものから、語と語の関連や構造を反映したものに拡張する必要性を感じたので、これへ向けて研究を進める。
|
次年度の研究費の使用計画 |
特徴抽出手法では組合せ探索をおこなうため、また、日本語のテキストを対象とするため、比較的大きな計算資源を必要とする。今後の研究推進による手法拡張により、いっそうの計算量増加が予想されるので必要に応じて計算資源の充実を行う。さらに、可視化における評価やデータ整理のため、謝金等も必要であると考えている。研究成果の発表等のために、国内外での学会や論文誌において研究成果の報告を行うための諸経費も必要である。
|