研究概要 |
2分決定木にもとづくノンパラメトリックな手法として,代表的なものにCARTやC4.5がある.本研究では,そのような2分決定木にもとづくノンパラメトリックなアプローチを正準判別分析法へ導入することについての検討を行った.2分決定木にもとづくノンパラメトリックなアプローチを導入した正準判別分析法を,正準判別分析木(Canonical Discriminant Analysis Tree)と呼ぶことにする.CDATでは,2分決定木を生成する際の改善の指標として,領域分割前後における群内分散共分散行列に対する群間分散共分散行列に関する固有値の総和の差を用いた.プログラミング言語Cを使って,ワークステーション上で,CDATのルーチンのプログラム化を行った.また,複数の筆者による筆跡の多様性を持たせるため,3名の筆者について,平仮名109種類の中から5種類を選び,手書き文字の学習・テストデータセットの作成を,X-Window Systemとプログラミング言語Cを使って,ワークステーション上で行った.そして,正準判別分析法とCDATの比較を,上記のデータセットを用いて,交差確認法により行った.その結果,複数の筆者による筆跡の多様性があるような場合に対して,正準判別分析法に比べ,CDATの方が,より良好であった.ただし,2分決定木によって分割される部分領域が小さくなり過ぎないように,閾値を設ける必要があった.CDATは,再帰的に2分決定木の階層を重ねることで,非線形な構造がより顕著であるような場合に対して,より有効である.
|