2017 Fiscal Year Research-status Report
人工的欠損値を導入した大規模データにおける知識発見
Project/Area Number |
16K00316
|
Research Institution | Fukuoka Nursing College |
Principal Investigator |
嶋田 香 福岡看護大学, 看護学部, 教授 (20454100)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 知識発見 / 人工知能 / ソフトコンピューティング / 欠損値 |
Outline of Annual Research Achievements |
世代継続的に成果を蓄積して課題解決をしていく進化型計算手法を用いて、欠損値を含むデータベースからIF~THEN~型ルール集合を発見する方法の応用として、データベースに人工的欠損値を導入することを特徴とする知識発見方法の研究開発を継続した。人工的欠損値は、ある方策によってデータベースの情報を間引いて隠すなどしたものである。28年度には、ルールベースの予測・分類問題における数値属性の離散化において離散化時の境界値付近の値を欠損値として扱うことを特徴とする方式を比較的小規模の医療データを用いた検討・評価したが、29年度には、ビッグデータにおいては情報の取捨選択などによるデータの有効活用が課題となることから、属性数の多い場合について拡張した方法の検討・評価を行った。また、本研究課題において基本となる方法と比較的小規模の医療系データを用いた人工的欠損値時の評価実験結果ついて、29年度に国際会議で発表した。さらに、与えられたデータベースに最適な人工的欠損値生成の設定法、属性間の欠損値発生条件の組合せ最適化などのアルゴリズムの検討を行った。とくに人工的欠損値生成の設定をルール発見アルゴリズムに組み込んで進化的に最適な設定を獲得していく方策をとる方法と、人工的欠損値の設定および設定対象属性の組合せを遺伝的アルゴリズムを用いて行う方法を検討した。属性数の増加に伴って人工的欠損値の導入による評価が複雑となることから、その評価法の検討についても行った
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究目的のうち「人工的欠損値を用いたルールベースの予測・分類問題解決アルゴリズムの提案」について、基礎となるアルゴリズムの拡張を行いながら、人工的欠損値の最適利用となる条件設定の方法の検討を行うなど、当初の計画通り進めている。ルールベースの予測・分類問題において離散化境界値付近の値の扱いに人工的欠損値を導入する方法に関する小規模の医療系データを用いた評価結果ついては、29年度に国際会議での発表を行っている。また、研究目的のうち「実社会に応用可能な人工的欠損値を用いた人間の思考様式に似た知識発見法の創成」については、所属機関の研究者らと協力して比較的大規模なデータを用いた医療専門家の視点からの発見されたルールの解釈や分類結果等の評価に関する検討を行っている。
|
Strategy for Future Research Activity |
今後は、これまでに得られた成果を基にして、予測・分類の精度向上などに有効な人工的欠損値の導入条件を見出すことによるデータベースの属性間の関連性を含めたデータ構造に関する知識発見方法を含めた検討を行う。人工的欠損値を利用することで、特定の属性のとる値のある領域、あるいはこれらの組合せが、別の属性のとる値の領域に与える影響等を把握することでデータベースの構造特性を獲得する方法を提案する。ここでは、データが人間の思考様式と同様に扱われるべき理想形といったものの考察を含めていくとともに、情報の選択利用に関する信頼性の指標や説明方法を提案する。人工的欠損値を利用した知識発見手法への応用展開を進め、その有効性を大規模データを用いて検証するとともに、得られた結果を取りまとめ、成果の発表を行う。
|
Causes of Carryover |
28年度に生じた次年度使用額を29年度の国際会議での成果発表のための外国旅費の一部として使用したことから、29年度の外国旅費の支出予定額との差額が生じたため。 次年度使用額は、30年10月開催の国際会議での成果発表のための参加登録料および旅費の一部として使用する計画である。
|
Research Products
(4 results)