研究概要 |
本研究では,距離幾何問題(データ間距離情報からデータの位置座標を決定する問題)について詳細な検討を行った.本年度は具体的に以下の成果を上げた: ・距離データに即して,高次元データを低次元空間にうまく埋め込む手法の開発を行った.特に,与えられたデータ間の補間データを自動生成する方法を考案した. ・本研究の距離幾何問題は,データマイニング問題と密接な関連を持つが,データマイニングで一番問題になる「与えられた高次元データ間の距離(類似度)をどのように定義するか」という問題の検討を行った.与えられた高次元データ間の距離構造を自動学習するアルゴリズムを提案し,高次元データを用いて数値実験を行った.その結果,与えられたデータに即した距離構造をうまく学習することができ,より適した低次元埋込みが実現できることが分かった. ・確率的近接データ埋込法(SPE:Stochastic Proximity Embedding)は,与えられたデータ対をランダムに選択するところに確率性が挿入されているアルゴリズムであるが,埋込みを行う(低次元空間での座標を更新する)アルゴリズムにも確率性を導入し,一つの座標値ではなく座標の分布を推定する方法を考案した.インスリンやグルカゴンデータを用いて,埋込み(分子立体構造推定)に関する数値実験を行い,その性能に関して従来法との詳細な比較・検討を行った.
|