2009 Fiscal Year Annual Research Report
頻度に基づく下方集合の高速探索を利用した構造データからの知識発見
Project/Area Number |
19300046
|
Research Institution | Kyoto University |
Principal Investigator |
山本 章博 Kyoto University, 情報学研究科, 教授 (30230535)
|
Co-Investigator(Kenkyū-buntansha) |
平田 耕一 九州工業大学, 情報工学研究院, 准教授 (20274558)
土井 晃一郎 京都大学, 情報学研究科, 助教 (10345126)
|
Keywords | 機械学習 / 知識発見 / 情報基礎 / 応用数学 / 下方集合 |
Research Abstract |
本研一の目標は,造化データからの頻度に基づく知識発見の基礎理論の構築を行うことである.抽出する知識の表現手法である「式」のなす束構造における下方集合の性質を中心に解明し,機械学習手法の一般的性質を明らかにすることを目的としている.本研究には首都大学東京・理工学研究科徳永浩雄教授,東北大学理学系研究科赤間陽二准教授が連携研究者として参画した. 本年度は,昨年度に引き続き,様々なデータに対する「式」のなす束構造を利用した機械学習・知識発見のための性質を分析し,アルゴリズムを実装して評価を行った.「式」としては,イデアルを表す多項式,時系列事象間の関係を表す有向グラフ(エピソード),一般のグラフ,木,述語論理における項である.特徴的な成果は以下の通りである. (1)多項式イデアルの一般系形である閉集合の応用を展開じた.理論面では,有界でない個数の閉集合の和集合の学習アルゴリズムを構成することができた.また, 閉集合をデータマイニングに応用することにより,公開ソフトウェアとその開発メーリングリストの相互関係からソフトウェア構造の抽出に成功した.また,分散配置した関係データベース.から,情報遺漏をできるだけ少なくするデータマイニングアルゴリズムを閉集合を用いて設計した. (2)木構造とエピソードを対象としたマイニングの網羅的研究を手無きすると共に,グラフのデータマイニングを用いてインフルエンザデータから地域間伝播を抽出することを試みた. (3)形式言語の正データからの学習を,固体物理の結晶解析に応用可能な形に展開して分析を行い,付随してVC次元の解析も行った.
|
Research Products
(16 results)