研究課題/領域番号 |
22700015
|
研究機関 | 石巻専修大学 |
研究代表者 |
原口 和也 石巻専修大学, 理工学部, 准教授 (80453356)
|
キーワード | アルゴリズム / 機械学習 / 人工知能 / グラフ理論 |
研究概要 |
記号データから計算によって学習を行うための従来のアプローチは、それを直接取扱うことのできるモデルを用いるか(決定木など)、数値データに変換して分離平面を構成するか(SVMなど)のいずれかに大別される。一般に前者はデータベクトル間の距離や順序関係に関する概念を用いず、後者は距離の概念を用いるため、結果的に順序関係をも取扱う。本研究課題は、順序関係のみに着目した記号データからの学習アルゴリズムの開発を目指すものである。 前年度の研究の経緯から、平成23年度は、任意の学習モデルがデータ空間を分割し、訓練事例のクラス分布にしたがって部分空間のランキング(順序付け)を暗に生成することに着目した。例えば、超平面モデルは分離平面からの距離によってランキングを生成し、決定木モデルは一つ一つの葉に点数を与えることによってランキングを生成する。真のランキングが与えられた人為的なデータで予備実験を行ったところ、決定木が生成するランキングと真のランキングの間のケンドール距離は、汎化誤差と高い相関を持つことを確認できた。解析を行った結果、2つのランキングの間の距離は、分類器の学習性能の評価指標の一つであるAUCと分類器の複雑さに相当する項の和で表されることがわかった。AICやMDLなど、これに類する量が汎化誤差と高い相関を持つことは既に学習理論の分野で広く知られており、我々の視点の妥当性が示唆されている。 現実には真のランキングなるものは与えられないため、今後は何らかの方法でそれを仮定できるようにモデルを拡張しなければならない。そのための予備実験に必要なプログラムコードを整備した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
東日本大震災のため、居住地と所属機関、およびその所在地である宮城県石巻市は被害を受けた。このため主に平成23年3月~5月にかけて研究を中断せざるを得ず、また震災に伴って発生した所属機関の様々な業務に平常時以上のエフォートを注がなければならなかったことから、研究活動が軌道に乗るまで時間を要したことが主な原因と考えている。
|
今後の研究の推進方策 |
幸い、今では震災前とほぼ同じ水準で研究活動を行えるようになった。研究の目標を決定木生成アルゴリズムの開発に限定し、今年度内に実験を終え、成果公表の準備を済ませる所存である。
|