2015 Fiscal Year Research-status Report
Project/Area Number |
15K00323
|
Research Institution | Doshisha University |
Principal Investigator |
大崎 美穂 同志社大学, 理工学部, 教授 (30313927)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 不均衡データ分類 / 混同行列 / カーネルロジスティック回帰 / 最小分類誤り学習 / 一般化確率的勾配法 |
Outline of Annual Research Achievements |
少数の危機的事例(少数クラス)と多数の通常的事例(多数クラス)で構成される不均衡データの分類は,がんの診断,交通事故の予測等の様々な分野に求められる.しかし,通常の分類器では多数クラスの強い影響を受け,少数クラスの分類性能が極端に低下してしまう.従来,様々な不均衡データ分類器が提案されたが,経験則的・タスク依存的,クラス間の性能バランスの制御が困難等の問題があった.本課題では,これらの問題解決と高性能な分類を目指し,カーネルロジスティック回帰(KLOGR),最小分類誤り学習・一般化確率的勾配法(MCE/GPD),混同行列(CM)から成る分類器(CM-KLOGR)を提案し,その有効性を明らかにする.
今年度の前半は,CM-KLOGRの理論的な枠組みの確立に注力した.この枠組みのうち,モデル構造はKLOGR(カーネル関数線形和とソフトマックス関数によるクラスの事後確率の推定)を基盤とした.目的関数と最適化には下記の2段階学習を導入した.KLOGRの利点を生かし,交差エントロピーを用いて初期設定を行う事前学習.MCE/GPDの利点を生かし,多様な評価基準の調和平均を用いて初期設定を改善する再学習.
今年度の後半は,CM-KLOGRのソフトウェアを開発した.まず,基盤となるKLOGRと,MCE/GPD学習,混同行列と評価基準の計算を実装した.次に,交差エントロピーと偏微分計算をKLOGRに組み込んだ事前学習,および,MCE/GPD・混同行列・評価基準を経て導出した評価基準の調和平均と,その偏微分計算をKLOGRに組み込んだ再学習を実装した.そして,事前学習と再学習を連結してCM-KLOGRを実現した.ベンチマークデータを用いた試行により,開発したソフトウェアの正しい動作も確認できた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度は予定通りに,新しい不均衡データ分類器CM-KLOGRを提案し,その理論的な枠組みの定式化とソフトウェア開発を実施できた.本課題は自身の過去の科研費研究課題から着想を得ており,以前からアイディアを具現化してきたことが功を奏したと考えられる.また,今年度前半の予定を前倒しして,人的・時間的コストが大きいソフトウェア開発を早めに開始した点も貢献したと考えられる.
|
Strategy for Future Research Activity |
次年度の前半には,開発したソフトウェアの詳細なデバッグと動作確認を行う.また,CM-KLOGRの比較対象となる従来の不均衡データ分類器も開発する.複数の開発者で並行してこれらの工程を行い,二重確認することで,ソフトウェアの信頼性を確実にする.後半には,複数のベンチマークデータを用いてCM-KLOGRの有効性を実験検証する.実験の設計では,過去の関連文献を詳しく調査し,どのような性質のベンチマークデータを選定すべきか,および,どのような条件設定にすべきかを検討・決定する.すでに今年度,実験にかかる計算コストを見越して計算機を購入したが,不足の場合は追加購入により対応する.実験結果を学会発表にて公表することも着手する.
|