研究概要 |
1)特徴量の分類:人間が判断に用いる知識は実数で表されるような数値的なものではなく,言葉で言い表される程度のある種大雑把なものであると解釈し,「粒度」の概念を導入した.また,離散的に表されるデータに関してもグルーピング問題として解釈し直し評価基準を与えると共に,準最適なグルーピングを発見するためのアルゴリズムの開発を行った. 2)プロトタイプの発見:人間が判断に用いる特徴はそれまでに得た知識全てではなく,それらの中から抽象化された数少ないデータであるとの観点に立ち,多量のデータの中から典型的な特徴を醸し出すプロトタイプを発見する方法を開発した.プロトタイプを点として捉えるのではなく,体積を持つものとして捉えることを提案するとともに,時間の経過と共に増える知識に見立ててデータが増加する際のプロトタイプ更新のアルゴリズムも提案した.また,類似性の観点から木構造をなすデータの中から,類似の構造を見出しグルーピングすると共に,頻度を数えることによって典型的な木構造を見出す研究も行った. 3)状況に応じた特徴量の抽出:一つに識別子によらない識別子独立型の特徴選択手法を提案した.また,最適な特徴集合はカテゴリやカテゴリ対象に依存するとの立場に立ち,ランダムに選び出した特徴により構成した特徴空間の中から特徴選択を行う方法により識別率の向上を目指す方法についても提案した.
|