2013 Fiscal Year Annual Research Report
離散値・数値混用データからの閉集合を利用した知識発見方式
Project/Area Number |
22240010
|
Research Institution | Kyoto University |
Principal Investigator |
山本 章博 京都大学, 情報学研究科, 教授 (30230535)
|
Co-Investigator(Kenkyū-buntansha) |
平田 耕一 九州工業大学, その他の研究科, 教授 (20274558)
徳永 浩雄 首都大学東京, 理工学研究科, 教授 (30211395)
吉仲 亮 京都大学, 情報学研究科, 助教 (80466424)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | 知識発見 / 機械学習 / 形式概念解析 / 閉集合 / 実数計算 |
Research Abstract |
本研究の目的は, 離散値データと数値データが混用されたデータからの新たな知識発見に対して,閉集合に着目した一貫性を持つ理論と手法を開発するとともに,構造データからの知識発見手法の深化を図ることにある.本年度の主な成果をあげる. 1.データからの閉集合の生成はすでに高速な手法が提案されているが,データが更新される場合には閉集合の高速な更新手法が必要である.そこで,既存データに新規データが追加された場合を対象にして,逆探索法を利用した高速な閉集合の更新手法を考案した. 2.日本語文の名詞・動詞と機能語の組合せを属性とした上で,閉集合を利用した知識発見を利用することにより,シソーラス拡張を行うという方式を前年度まで開発してきた.その改良を行い,閉集合を利用が効果的であることを確認した.離散値データと数値データの実データとして,新聞記事と株価データとを組合せたデータから,閉集合を用いて株価変動におけるフェーズを同定することを試みた.データから構成される閉集合が束構造をなすことに着目し,束構造を分析することにより異常値データを検出する方法を開発した. 3.文字列データを非可換半群の要素とみなしたとき,単項式をデータから獲得する手法がデータ圧縮とみなせることに着目し,複数の文字列データからデータ圧縮と知識獲得を同時に行う手法を提案した. 4.知識発見の基本である木構造データ間の共通部分を抽出する手法は一般に計算量が大きいことが知られているが,近年高速化が進展している整数計画法に着目し,木構造間の共通部分抽出を整数計画法に変換して算出する手法を提案した.さらに,木構造データには様々な型が定義できることから,いくつかの型に着目して,知識獲得手法を考案した.その中には,植物の形状をモデル化するのに適した木構造の型であり,インフルエンザ・ウィルスの進化データを表現するために利用しやすい型がある.
|
Current Status of Research Progress |
Reason
25年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
25年度が最終年度であるため、記入しない。
|
Research Products
(17 results)