研究課題/領域番号 |
17J03593
|
研究機関 | 電気通信大学 |
研究代表者 |
辰巳 嵩豊 電気通信大学, 情報理工学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2017-04-26 – 2020-03-31
|
キーワード | 学習分類子システム / データマイニング / 雑音 / 分類問題 |
研究実績の概要 |
本研究では機械学習の一手法の学習分類子システムを用いて、実環境から取得されたデータから人間にとって解釈性の高いルールを獲得するために(1) 環境からの入力, 環境への出力及びその出力に対する評価である報酬が「特定」の分布に従う環境への適応,(2)入力, 出力及び報酬が「不特定」の分布に従う環境への適応, (3)学習に用いるデータ数が少なく入力の種類に偏りがあり十分に環境全体を網羅できない環境への適応に取り組む。 その目的達成に向けて平成30年度は(2)及び(3)に対して取り組んだ。(2)に関しては入力, 出力或いは報酬のいずれかに対して雑音が付加された環境において、雑音が付加されている場所に関する情報なしに、雑音の影響を除去した際に評価対象のルールが獲得する報酬の値を推測することで適応可能な学習分類子システムを構築し、(3)に関しては昨年度に提案した学習データの入力の種類に偏りがある環境において極端に高い報酬あるいは極端に低い報酬を獲得するルールに絞って獲得する学習分類子システムを複数の分類問題に適用し、適用する問題によらず安定的に学習が可能であることを示した。 本研究の成果の社会に向けた発信として、(2)に関わる成果を国際学会のThe Genetic and Evolutionary Computation Conference (GECCO) 2018のWorkshop及びSCIS&ISIS 2018において各1件発表した。また、(3)に関わる成果を英文論文誌SICE Journal of Control, Measurement, and System Integrationに発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
目的達成のため、(2)の入力, 出力或いは報酬のいずれかに対して雑音が付加された環境に適応可能な学習分類子システムの考案及び(3)の入力の種類が偏る環境に適応可能な学習分類子システムの適応可能範囲の問題に対する依存性について検証を行った。(2)に関して具体的には、昨年度に(1)に対して考案した、評価対象のルール単体ではなく、その時点で学習分類子システムが獲得しているルール全体と比較を行う事で、付加されている雑音を除去した際にそのルールが獲得する報酬を推測し、そのルールを保持すべきか否かを判定する機構を有する手法を入力, 出力或いは報酬のいずれかに対して雑音が付加された環境に適応可能なように拡張した。これにより従来手法では学習が正しくできない強度の雑音が付加された環境においても雑音が付加されていない場合とほぼ同等な性能(90~100%)を実現した。(3)に関して具体的には、所属研究室によって取得された、介護施設におけるケアプランと睡眠ポリグラフによる睡眠段階の深さのデータやUCI Machine Learning Repositoryに収録されているSGEMM GPU kernel performance problemなどの分類問題に対して適用し、問題によらず活用されやすい高い評価のみを獲得する知識或いは低い評価のみを獲得する知識を獲得可能であることを示した。 (2)において入力, 出力或いは報酬のいずれかに対して雑音が付加されている環境に対して、付加されている雑音に関する情報なしに獲得すべきルールを判別する手法を考案したこと及び(3)の問題によらず活用されやすい高い評価のみを獲得する知識或いは低い評価のみを獲得する知識を獲得可能であることを示したため、おおむね順調に進展していると評価した。
|
今後の研究の推進方策 |
今後の研究の推進方策としては、申請書に記載した計画を進めることを基本とする。(2)入力, 出力及び報酬が「不特定」の分布に従う環境への適応, (3)学習に用いるデータ数が少なく入力の種類に偏りがある環境への適応をさらに進めていく。 具体的に(2)に関しては、昨年度までに考案した、獲得した知識の集合から任意の知識が獲得する報酬を推測する機構を有し、入力, 出力及び報酬の分布によらず、人間にとって解釈性の高い知識を獲得可能な手法の拡張により、対応を図る。さらに、入力, 出力及び報酬のいずれかが単一で「不特定」の分布に従う環境及び入力, 出力及び報酬が複合的に「不特定」の分布に従う環境における獲得された知識から、考案した手法と入力, 出力及び報酬の分布による学習性能への影響の体系化を試みる。また(3)に関しては、これまでに構築した手法に加え(2)の課題において拡張した手法に対して、獲得した知識の集合からデータ数が少ないあるいは無いデータが獲得する報酬を推測する機構を付加することによって対応を図る。それらの手法をデータ数に偏りがあるオープンデータや所属研究室が独自に取得した介護施設における介護プランと睡眠の質の関係のデータに対して適用し、獲得された知識とその評価から、用いた問題の体系化及び手法の適用範囲を明らかにする。 最後に、昨年度に引き続き国内・国際学会(CEC2019及びGECCO 2019 Workshopに採択済み)及び学術雑誌において、本研究成果を社会に向けて発信する。
|