研究課題/領域番号 |
26330281
|
研究機関 | 大阪府立大学 |
研究代表者 |
本多 克宏 大阪府立大学, 工学(系)研究科(研究院), 教授 (80332964)
|
研究分担者 |
野津 亮 大阪府立大学, 工学(系)研究科(研究院), 准教授 (40405345)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 共クラスタリング / ファジィクラスタリング / 意思決定支援 / 文書解析 / Webデータ解析 |
研究実績の概要 |
本研究では,大規模な共起関係データに対する共クラスタリングによる情報縮約を通して,文書データやwebデータの効率的な解析技術を確立し,ヒトに優しい知的情報処理技術を実現することを目的としている.初年度は主に理論的側面からの展開として,以下の成果を上げた. (1) 大規模な共起関係データが複数のサイトに分散保存されている場合に,それらを一箇所に集約することなしに,効率的でかつプライバシーの侵害なしに共クラスタリングを適用するアルゴリズムを開発した.分散するデータベースの個々に内在する共クラスター構造のみを共有することで,計算効率の良いクラスター構造分析が可能になると同時に,他のサイトに対する情報漏えいを防いだ安心・安全なデータ活用を可能としている.これらの成果について,1件の学術論文発表,1件の国際会議発表および1件の国内学会発表を行った. (2) ファジィ共クラスタリングにおけるモデルパラメータの設定の困難さを改善したモデルとして,混合多項分布のファジィ拡張となる共クラスタリングアルゴリズムを開発し,さらに個体と項目の分割の明確化のための改良を行った.文書解析における文書群の内容要約における有効性を確認した.これらの成果について,2件の国際会議発表および2件の国内学会発表を行った. (3) ファジィクラスタリングの理論的基盤の考察として,クラスター構造の妥当性検証や不確定性の処理法,意思決定問題への適用可能性に関する研究を行った.(1)や(2)で開発した理論モデルを実データへ適用する際のモデル改良に必要となる知見が得られた.これらの成果について,3件の国際会議発表と1件の国内学会発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
主に理論的側面からの展開を図った初年度としては,当初の研究の目的を十分に達成する成果を得た.以下に、個別の課題における達成状況を述べる. (1) 大規模な共起関係データの活用にかかる課題では,単一のデータベースの分析だけでは知ることのできないグローバルな知見を効率的に活用するために,垂直分割データの分析において元の観測データではなく共クラスター構造のみを共有するアルゴリズムを構築し,個人のプライバシーの保護も保証した分析手法を確立した.これらの成果は,当初の「大規模データの活用」に「個人情報の保護」の観点も付加した展開を達成しており,当初に想定した目標を完全に達成するものであった. (2) 混合多項分布からの発展によるファジィ共クラスタリングの開発にかかる課題では,確率モデルとの比較に基づくファジィ度の調整法を確立し,確率的手法に勝る有用性を示すに至るまで,想定を超える成果が得られた. (3) その他の展開としては,当初に想定した「オンライン逐次学習」による改良において十分な成果を得ることができなかったものの,異なる視点に基づいて「複数サイト間での分散データ処理」による効率化を達成した上に,Toleranceを考慮したロバストクラスタリングモデルの拡張などの展開も示されており,目標とするレベルに達した成果が得られたといえる.
|
今後の研究の推進方策 |
当初の想定通り,第2年度以降は,理論的・応用的側面の両面について展開を図る.理論的側面については,初年度に開発した混合多項分布のファジィ拡張による共クラスタリングモデルにおいて,ファジィ度の調整による分割特性の検証を深め,決定論的アニーリング機構を導入することで,初期値依存性と共クラスター明確性の両面で確率モデルを凌駕するファジィ共クラスタリングアルゴリズムの開発を目指す.また,大規模データの分析における部分的な教師情報の活用を目的に,半教師あり学習機構の導入を検討し,文書データ解析での有効性を検証する. 一方,応用的側面については,webデータ解析への適用を視野に入れ,新たに入手したTwitterデータを用いた実証実験を計画している.現在,IT関連企業からの協力を得る体制が整い,データの前処理が進んでいる.web上のテキストデータ解析は大規模共起関係データ解析の代表例であり,実用性の検証に適した応用展開が期待できる. そのほか,第3年次に向けては,ゲノム情報要約などへの拡張も視野に入れ,基礎データの収集などを行っていく.
|
次年度使用額が生じた理由 |
平成26年度内に掲載を計画して投稿していた雑誌論文について、査読日程の遅れにより平成27年度に掲載される見込みとなったため。
|
次年度使用額の使用計画 |
平成27年度に掲載される雑誌論文の掲載料として使用する。
|