研究概要 |
研究実績は以下のとおり. 1.統合機械学習環境の構築 大量のデータを扱うための効果的なトライ構造を用いたインデッキシングやデータ管理法を検討し,前年度までに部分的に構築してきたモジュール(属性選択手法,データ削減手法,属性構築手法)を総合して統合機械学習環境を構築した.各手法は部品化されており,プラグイン形式で組み込まれているので,個別の部品の改良は自由に行える構成となっている. 2.実データによる検証と今後の課題の整理 医療データ,機械学習用ベンチマークデータを用いて,上で開発した統合機械学習環境で知識発掘を行い各手法の有効性を検討し,不備な点や課題を明確にした.全てのデータに対して万能な手法は存在しないので,どのような特徴をもつデータに対してはどの手法が適しているかの対応関係を体系的に整理した. 3.検証結果に基づく各手法の改良 検証過程で見出された不備な点で今年度中に対処可能なものを解決し,統合環境にフィードバックした.
|