2008 Fiscal Year Annual Research Report
Project/Area Number |
20700081
|
Research Institution | Chiba University |
Principal Investigator |
森 康久仁 Chiba University, 大学院・融合科学研究科, 助教 (40361414)
|
Keywords | 可視化 / 機械学習 / データマイニング / 特徴選択 |
Research Abstract |
平成20年度における研究実績は2件の研究発表を行った. これらの発表では, 最近の重要課題である複雑に構造化したデータの可視化方法の検討, および実際の分類問題への応用を検討したものである. 以下に概要を示す. ・グラフ表現による有効なデータ可視化手法の検討 必要な情報を過不足なく表現するグラフ表現を考える. 具体的には, グラフの構成方法(頂点の配置, 隣接関係の表現方法)を段階的に行う手法についての検討を行った. また, 実際の遺伝子発現データのデータ構造を可視化することで定性的な評価を行った. ・分類問題への適用 大特徴・小サンプル問題である遺伝子発現データの分類問題において効果的な特徴選択を行う手法を提案した. これら遺伝子発現データなは複雑に構造化したデータであり, 実際の分類問題としては非常に難しい問題であるものの, 本提案により分類に有効な特徴のみを取り出すことで, 認識率を向上することができた. 現在のデータ解析において望まれることは, 従来の方法論がそのまま適用できないような大規模な問題(カテゴリ数, 変量数, データ数が多い場合)に対して, 十分効率良く, かつ高精度な解析が行えることである. この問題に対してこれらの成果では, 複雑な構造を持つデータを適切に解釈する一つの方法を与え, 有限個のデータの構造を適切に解析することにより, いわゆる学習やパターン認識の問題に対する認識率や学習性能を高めるための方法論の解明や, データ間の関係が複雑に依存しあっているようなネットワーク構造の解明の一端を担える可能性を示した.
|
Research Products
(2 results)