2012 Fiscal Year Research-status Report
データ融合のモデル化と不確定性を扱うデータマイニング
Project/Area Number |
24500182
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kanagawa Institute of Technology |
Principal Investigator |
松本 一教 神奈川工科大学, 情報学部, 教授 (40350673)
|
Co-Investigator(Kenkyū-buntansha) |
大須賀 昭彦 電気通信大学, その他の研究科, 教授 (90393842)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | データマイニング / 時系列データ / 相関ルールマイニング / レスポンス時間 / データフュージョン |
Research Abstract |
データマイニングを適用する際には,データマイニングアルゴリズムで処理可能なように,必要なデータを単一データベースとして整える必要がある.一般には必要な情報が複数の情報源に分散しているため,この作業のコストが高くなり自動化が必要である. この解決のために,本年度では主として2つの方向からの研究を行った. 第1のアプローチでは,数値時系列データに対して,それに関連する複数のテキストデータベースがWeb空間上に分散している状況を想定した研究を進めた.与えられる数値時系列データには,Web空間を探索する場合のキーワードおよびWeb上の探索対象範囲を与えるごくわずかなメタ情報が与えられると仮定して探索を行う手法を採用した.また探索されるWebには様々なテキスト情報が含まれるために,事前に与えるオントロジーを使って標準化する手法も開発した.このようにして,当初の時系列データにテキストデータを融合(フュージョン)した単一データベースを作成する手法を開発した.このデータベースに対して,相関ルールの概念を拡張した知識表現およびそれをマイニングするアルゴリズムの開発を行った.経済データを用いて実験し,データの融合により知識の精度や有用性が向上することを確認した. 第2のアプローチでは,アンケート等により得られる個人の嗜好に関するデータを想定した研究を進めた.未知の項目に対するデータ融合を行うために,アンケート調査をWeb上で行うようにして,回答するまでのレスポンス時間を自動的に収集するようにした.アンケート内に回答者が陽には気づいていない潜在的な意識に関する事項がレスポンス時間から推測できるようにすることで,類似の潜在意識を持つ回答者を発見できるようにした.潜在意識の類似性という新たな観点からデータ融合を行うアルゴリズムを開発しその有効性を家電製品の嗜好に関する実験により確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本申請の研究では,理論的な方向からの研究と実装や実験を主体とした応用的な方向からの研究から構成されている.このうち,理論的な研究に関しては,当初の計画よりも遅れを生じており,データ融合のための可能世界モデルの構築が途上にある.一方において,応用的な研究に関しては,当初の予定よりもやや進んでおり,データを用いた実験を行うことができている.とくに,応用的研究の第1のアプローチでは,経済データを用いて実験し,データの融合により知識の精度や有用性が向上することを確認した.応用的研究の第2のアプローチでは,家電製品に関する嗜好状況のアンケートデータを用いて等その有効性を実験により確認した. 以上を総合して,理論的な研究の若干のマイナスと応用面の研究の若干のプラスがほぼ相殺することとなり,全体的には当初の計画に対して概ね順調という進捗と判定できる.
|
Strategy for Future Research Activity |
本申請の研究では,理論的な方向からの研究と実装や実験を主体とした応用的な方向からの研究から構成されている.平成24年度では理論的な面からの研究進捗がややマイナスであったため,平成25年度ではその遅れを取り戻すことに力を入れる予定である. データ融合で生じる多くの可能性を表現できるモデルを構築するという最終目標に向かって,可能世界を表現できるようにする.その上で確率的に尤もらしさを表現できるようにする. 応用的な研究では,前年度に続いて実験データを充実させて,より内容の濃い実験と検証ができるようにする. 理論的な研究成果と応用的な研究成果を総合するシステム化についても開発を進め,実験の質が向上できるようにする.
|
Expenditure Plans for the Next FY Research Funding |
研究成果を広く公開するために,国内発表を1回(国内旅費5万円),海外発表を3回(海外旅費80万円)計画しており,研究成果公表費用として15万円も計画している.研究のために使用する主なコンピュータ機器については,すでに研究室で保有している設備が相当程度利用可能である.そのため,本研究のために専用で用意するディスク装置などの周辺機器に20万円を利用する予定である. 研究分担者(大須賀教授)には研究費として30万円を配分する計画であり,その予算は上記で計上している海外発表に用いる予定である.
|