研究課題/領域番号 |
14J04555
|
研究機関 | 京都大学 |
研究代表者 |
大滝 啓介 京都大学, 情報学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2014-04-25 – 2016-03-31
|
キーワード | パターンマイニング / データマイニング / 形式概念解析 / 類似度グラフ |
研究実績の概要 |
構造データからの知識発見は計算量が高く困難な場面が多い。またデータが増えるにつれて出力が膨大になることが多いため、その解釈も困難な場面が存在する。 本研究の目的は、構造データからの知識発見手法をより高度に発展させること、またその可視化手法について研究を展開することにより、最先端の知識発見手法を構築することである。本年度は特に基礎的な学習手法・アルゴリズムや、知識発見におけるモデルの定義、望ましい性質の定式化に着目して研究を行った。 (1)「構造データを対象とした先端的知識発見手法の研究」として,主に時間に基づいて整列されたデータベースからの知識発見を対象とした。時間に沿ってイベントが保存されたデータベースから、イベントの遷移関係や時間的な前後関係を発見する知識発見手法であるエピソードマイニングを題材とし、列挙されるエピソードの効率的な解釈方法やアルゴリズムについて研究を展開した。特に「形式概念解析」と呼ばれる基本的なデータ解析モデルの発展系である「パターン構造解析」と呼ばれる手法に着目し,エピソードマイニングと共に用いることで、エピソードのクラスタやその相互関係を得る手法を構築した。その有用性を計算機実験から確認した。 (2)「知識発見のための機械学習応用」として,データベースに含まれるデータから特徴を事前に学習し,効率的なデータの前処理を行う手法について研究を行った。具体的にはデータベースに関する知見を類似度グラフの形で構築し、機械学習手法を応用する手法を研究した。これはデータの生成モデルを想定した上で問題を議論する機械学習手法の取り組み方であり、それを知識発見アルゴリズムへと展開することで、新たな手法を構築したといえる。またその有用性は計算機実験によって確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
新しくパターン構造解析(Pattern Structure Analysis)に基づいた知識発見手法を研究し、論文発表を行った。また国内ワークショップのポスター発表を行い、束構造を利用した知識発見のためのモデル・アルゴリズムに関して議論を行った。これらにより、申請書で想定した基本的な学習手法の構築・可視化手法への発展を達成したと考える。
来年度以降の研究をより発展させるため、学習手法だけではなく、束構造自体に関する研究を行った。特に、データマイニング・機械学習において情報量基準を適用する手法の枠組みとの関連性をいくつか明らかにした。これらを踏まえると次の年度において研究の発展が見込まれ、十分な準備が達成された。
これらから、総じて計画は順調に進んでいるものと考える。
|
今後の研究の推進方策 |
今年度までに構築したアルゴリズムの計算機実験をより進める。そのため様々なデータを用意し、実験を行う予定である。また効率的なアルゴリズムや、実験・手法の評価方法に関して調査する必要がある。これについては既存の研究等も参考にする。これらを踏まえて、新たに効率的で利便性の高いアルゴリズムの構築を行う。
今年度は主に基本的な形式の系列データ、及びそこから生成されるグラフデータを扱った。今後はより一般的なグラフ構造やデータマイニングの問題・手法を対象とし、一般的な知識発見手法のための可視化手法を研究する。
|