研究分担者 |
平田 耕一 九州工業大学, 情報工学部, 准教授 (20274558)
廣渡 栄寿 北九州市立大学, 基盤教育センター, 教授 (60274429)
徳永 浩雄 首都大学東京, 理工研究科, 教授 (30211395)
立木 秀樹 京都大学, 人間・環境学研究科(研究院), 准教授 (10211377)
|
研究概要 |
本研究の目的は,離散値データと数値データが混用されたデータからの新たな知識発見に対して,両者を融合させる一貫性を持つ理論と手法を開発することにある.本研究では,両者に共通の概念である"閉集合"に着目し,さらに形式概念解析と自己相似集合を利用することによりに,離散値と数値の差を埋めて,両者を統一的に扱えるような知識発見理論と手法を構築することを目標とする.本年度は,昨年度までの基盤研究と挑戦的萌芽研究で展開してきた理論と手法を,本研究の枠組みで捉え直して,両者が融合可能な形に再定式化することを中心に研究を展開してきた.すなわち,下方集合を用いた離散値知識発見を代数的閉集合の知識発見として捉えなおし,位相的閉集合と自己相似集合を用いた数値知識発見を,自己相似閉集合の知識発見として捉えなおした上,両者を融合する理論構築を試みた.融合の基盤としては,半教師有学習を設定し,知識発見アルゴリズムの構成を試みた.また,代数的閉集合を用いた離散値知識発見,位相的閉集合を用いた数値知識発見の展開も行った.前者は,グラフなどの構造化データを対象とし,閉集合に制約を導入した場合の知識発見アルゴリズムの構成,クラスタリングに用いるためのデータ間距離の研究の展開,代数的閉集合の和集合を対象とした計算論的学習研究の展開,形式言語を利用した知識発見と計算論的学習理論の展開,形式言語を利用したRNAデータからの知識発見手法の開発を行った.数値知識発見については,実数の2進符号化を利用したクラスタリング用の新たな偽距離の開発,2進符号化の自然画像探索への応用,実数のグレイ符号化を用いた計算論的学習の展開などを行った.関連研究者との研究交流を促進するため,「第7回論理と学習に関する国際ワークショップ(LLLL 2011)」を3月に開催した.「第6回データマイニングと統計科学に関する国際ワークショップ」および「電子情報通信学会情報論的学習理論と機械学習研究会」と併催し,LLLLだけで40名の参加があった.
|