2008 Fiscal Year Annual Research Report
知識融合最適化による不確実データに対するクラスタリングアルゴリズムの開発
Project/Area Number |
18500170
|
Research Institution | University of Tsukuba |
Principal Investigator |
遠藤 靖典 University of Tsukuba, 大学院・システム情報工学研究科, 准教授 (10267396)
|
Keywords | クラスタリング / 不確実性 / 知識 / 最適化 / ソフトコンピューティング |
Research Abstract |
本年度は、まず、前年度に引き続きデータ解析において人間が利用する知識に関する調査を行った。ウェブやメディア上で公開されている情報等を通じて、不確実性の処理、特にリスク認知に対する人間の処理モデルの構築を行い、実際のデータと比較検討することにより、モデルの妥当性を検証した(研究実施計画(1)に対応)。次に、構築したモデルがデータ解析、特にクラスタリングアルゴリズムに援用可能であるかの検討を行い、現実問題に適応可能な不確実性を扱うことのできるモデルを開発した(研究実施計画(2)、(3)に対応)。開発したモデルのうち主なものは、許容範囲という概念と、確率類似度という測度に基づくものである。許容範囲とは、許容ベクトルという概念をクラスタリングの基本となる目的関数に組み込むことにより、データの持つ不確実性を最適化の枠組みで議論することを可能にした新たな手法であり、確率類似度とは、確率距離をもとにして構成された、データ間の類似度を確率の枠組みで扱うことのできる新たな測度である。これらのモデルを用いて、アルゴリズムのプロトタイプを構築した。さらに、そのモデルをべ一スにした、不確実性を扱えるアルゴリズムの構築を行った(研究実施計画(4)に対応)。これらの成果を、コンピュータによって、実データを用いた構築アルゴリズムの有効性を検証したとともに、国内外の研究会・国際会議、ジャーナルへの投稿を通じて発表した(研究実施計画(5)に対応)。
|