研究課題/領域番号 |
16K16116
|
研究機関 | 山口大学 |
研究代表者 |
間普 真吾 山口大学, 創成科学研究科, 助教 (70434321)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | データマイニング / 人工知能 / 機械学習 / パターン認識 / ニューラルネットワーク |
研究実績の概要 |
本研究は,大規模データに潜む知識の発見とその構造化を図るホロニック構造型識別器の構築を目的としているが,本年度は,目的達成のための基盤となる方式の提案を行った.具体的には,ルールの発見と選択を行う「多層パーセプトロンを用いたルールベース型識別器のアンサンブル学習法」,教師データ数が限られる場合にも効率的に知識の抽出が可能な「半教師ありデータマイニング法」,「大量のルールをクラスタリングし識別システムの性能向上を図る手法」を提案した. 1. 多層パーセプトロンを用いたルールベース型識別器のアンサンブル学習法は,データの識別を行う際,すべてのルールを使用するのではなく,識別すべきデータの特徴によって使用するルールを多層パーセプトロンによって効果的に選択する方式である.識別率を,提案方式あり,提案方式なし,およびランダムフォレストの間で比較したところ,提案方式の有用性が明らかとなった. 2. 半教師ありデータマイニング法では,少数の教師ありデータと大量の教師なしデータを効率的に学習に利用することで,識別率の向上を図った.一般に,教師データが少数であるとき,データマイニングによる信頼性の高いルール抽出を十分に行うことができない.そこで,大量の教師なしデータから大量の候補ルールを抽出し,さらに少数の教師ありデータによって抽出ルールの信頼度を計算する方式を提案した.提案方式は教師データ数が限られる場合において,サポートベクターマシンと比較して優れた識別率を示した. 3. 大量のルールをクラスタリングし識別システムの性能向上を図る手法では,あるクラスに所属する大量のルールを,その特徴によって複数のサブクラスに分割し,より細やかな識別を可能とした.ルールの分割には,多目的遺伝的アルゴリズムを用い,識別率を提案手法と複数の従来手法との間で比較したところ,提案手法の有用性が明らかとなった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
大規模データから知識を抽出し,それを構造化するには,効率的なルール抽出アルゴリズムと,様々な概念を統合するアンサンブル学習法が基盤となるが,本年度は1.ルールベース型識別器のアンサンブル学習法と,3.大量のルールをクラスタリングし識別システムの性能向上を図る手法でそれを実現している.2.半教師ありデータマイニング法は,1.および 3.の方式を強化するものであり,実世界に存在する整理されていない大量のデータを有効活用するために必要なものである.
|
今後の研究の推進方策 |
次年度は,本年度の研究成果を発展させ,複数の抽出概念を連携させる識別器の強化を図る.具体的には,1.データ識別アルゴリズムの強化,および2.応用システムへの展開を予定している.1.では,転移学習,能動学習,半教師あり学習などの効率的な組合せによって,様々な概念に基づく判断を統合するメカニズム,および限られた数の教師データを効率よく学習に利用する方式の研究を行う.また,未知のパターンに対する識別が可能なアルゴリズムの研究を行い,特に画像認識問題に応用を検討する.2.では,構築したアルゴリズムを医用画像診断システムや人工衛星画像分析に応用し,その結果をアルゴリズムの性能改善に生かす研究を行う.
|
次年度使用額が生じた理由 |
旅費を当初計画より抑えることができたため
|
次年度使用額の使用計画 |
来年度成果発表旅費として使用する予定
|