2004 Fiscal Year Annual Research Report
論理関数に基づくデータからの構造的知識の獲得に関する研究
Project/Area Number |
15700019
|
Research Institution | Kyushu University |
Principal Investigator |
小野 廣隆 九州大学, 大学院・システム情報科学研究院, 助手 (00346826)
|
Keywords | データ解析 / 論理関数 / 知識獲得 / しきい関数 / 組合せ最適化 / 部分文字列パターン |
Research Abstract |
本研究の目的は,特徴的な構造を持つ論理関数の性質を用いてデータに存在する論理的、構造的な説明を与えるシステムを構築することにある.例えば分解可能な論理関数を用いた場合,概念を階層的な形で捉えることができるため,ルールはもちろんのことデータベースの属性間の階層的な構造も抽出することが可能となる.例えば,ある病気に関する診断データベースでの応用を考えた場合,属性間の階層的な構造は病気がどのようなプロセスを経て起こるかに対応すると考えられるため,本手法(構造的なデータ解析)は,より強い分析力を持つと言える.このように,従来は経験を摘んだ人間によってしか得ることのできなかった現象に存在するある種の構造を抽出することが可能となるため,上記のような医療分野のみならず,様々な分野(例えばエキスパートシステム構築の補助なども含まれる)において,本手法は有効であると考えられる. 今年度は本システムの構築を考える上で現れる,諸問題に対する計算の複雑度を明らかにすることを目的に研究を行った.今年度の視点は主に以下の2点に代表される.1.代表的な構造的関数の一つである正関数をしきい関数を用いた表現により,簡潔に表現することを考えた.しきい関数を用いることにより,正関数が指数的に圧縮された形で表現されうることは良く知られている.本研究では特に,正論理関数の重みに制約を課したしきい関数和による簡潔な表現を求めることがNP困難であることを示すと同時に,近似的にこれを解く手法について提案を行った.2.文字列データに対する拡張の観点から,特に固定長部分文字列パターンによるデータ列に対する表現に関して議論を行った.文字列データを論理関数空間にマッピングする上で固定長部分文字列パターンによる効率的なマッピングが望まれる.固定長部分文字列パターンは多く存在するが,単純に簡潔なものを求めようとすると過汎化の問題により望ましくないマッピングが得られてしまうことが多い.本研究ではこの過汎化を避ける問題を最適化問題として定式化することにより,本マッピング問題の計算複雑度を議論し(NP困難),近似アルゴリズムを与えた.
|
Research Products
(5 results)