研究分担者 |
渡辺 治 東京工業大学, 大学院・情報理工学研究科, 教授 (80158617)
高須 淳宏 学術情報センター, 研究開発部, 助教授 (90216648)
篠原 歩 九州大学, 大学院・システム情報科学研究科, 助教授 (00226151)
今井 浩 東京大学, 大学院理学研究所, 助教授 (80183010)
安倍 直樹 東京工業大学, 大学院・総合理工学研究科, 客員助教授
|
研究概要 |
巨大データベースからの知識発見を試みるとき,データ処理に要する時間やデータを格納するためのメモリー等,計算のリソースの制約が,データ量が膨大となるにつれて厳しい障壁となり,この障壁を乗り越えるための手法の開発が不可欠となる.この厳しい制約のもとで,膨大な“薄い"データを有効で意味のあるコンパクトなデータに変換するためには,巨大データの組織化や知識の抽出において限界まで効率化を図ることに要求される.これまで計算学習理論でも取り扱われてきたデータの抽出のメカニズムも参考にしながら,いろいろの個別問題を取り挙げ,知識抽出の基本問題や抽出方法について研究した.得られた主な成果は次のとうりである. 1. 特徴空間にユークリット距離やKullbac-Leibler Divergenceをその特殊例として含む一般的な幾何学的な距離を新しく導入し,これに基づきテキストやイメージからなる大量データのクラスター化を行い,この幾何学的距離の妥当性を検証した. 2. 学習アルゴリズムからの各種質問対象として,多項式時間で学習可能であることを,1回の質問により棄却される仮説空間の割合がある一定の値以上であるという条件で特性化できることを示した. 3. エキスパート集団に属する各エキスパートの予測を統合して,その集団の最適のエキスパートと同等の予測性能を実現する,オンラインエキスパートモデルを,階層構造に組み立てることにより,決定木の最適枝刈りを求めるアルゴリズムを与えた. 4. 方向選択問題を解くためのvon der Malsburgのニューラルモデルに基づき,ある種の“制約"のもとでの生き残りゲームから仮説選択をする基本アルゴリズムを導出した. 5. 学習者が何を質問するかを得られる情報を最大にするように,選択できるとする枠組みは,強化学習として定式化できる.この強化学習の手法が,これまで機械学習やデータマイニングの分野で開発されてきた手法に匹敵する計算効率を持つことを,計算機シミュレーションにより検証した. 6. 特徴ベクトルで表わされるオブジェクト集合から知識発見を行うための特徴空間の操作法について,オブジェクト間に構造的な制約がある場合の分類法を提案した.
|