研究課題/領域番号 |
23760358
|
研究機関 | 大阪府立大学 |
研究代表者 |
佐賀 亮介 大阪府立大学, 工学(系)研究科(研究院), 助教 (10509178)
|
キーワード | 可視化 / テキストマイニング / 時系列分析 / データマイニング / 逐次確率比検定 / アソシエーションルール |
研究概要 |
本研究では、時系列テキストデータ可視化手法であるFACT-Graphの統合と、その拡張法として因果関係の表出化を行うことを目的としている。FACT-Graphはクラス遷移分析と共起グラフを組み合わせることで、トピック単位でのマクロなトレンドの発見や、頻度は少ないが重要な語句や複数の語で構成される話題などを効率的に分析することができる。 しかしながら、局所的に特徴のあるキーワードやリンクの抽出がうまくいくとは限らず、また共起のみの表記のため、リンクの解釈が難しいといった問題点があった。 そこで、本年度は、局所的なキーワードやリンクの抽出と、局所的なキーワードの統合方法、また共起のために無向グラフであるFACT-Graphを有向グラフ化を行うための研究を行った。 前者においては、分析対象のデータセットを単位期間で区切り、そして分割された各データセット各々からキーワードを抜出し、それを統合するという手段を用いた。本研究において、抽出の際の基本プロセスや、分割されたデータベースから抜き出したキーワードをどのような基準で統合するかといったことについて、KES-IIMSS 2012で報告し、また、HCII2013において報告する予定である。また、そのデータセット分割の基準の定め方の方法として、逐次確率比検定を用いた手法を提案した。この逐次確率比検定を用いた手法を用いて、FACT-Graphを可視化する方法を提案し、これをKES2012にて報告した。 後者において、無向グラフから有向グラフにするために、データセットからルールを抽出し、そのルールに基づいて有向グラフ化を行った。具体的に、アソシエーションルールを用いて抽出し、有向グラフ化を行った。この結果はACIS2012にて報告された。この後者に関する研究はさらに実施する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
初年度における所属研究機関変更とそれに伴う予算執行の一時停止により、研究が一時停止したため少々遅れている。ただし、基礎実験は進んでおり、論文としての結果報告、また分析ツールの改良により、分析の速度自体は向上しており、十分取り戻せる状況である。
|
今後の研究の推進方策 |
今後の研究の方策として、有向グラフ化したリンクの改良と分類、その意味づけを行う。現在、アソシエーションルールによる抽出が達成できたが、このルールの意味づけがなされていない。また、時系列を考慮したルール抽出になっていないといった問題もある。そこで、今後は、系列パターンマイニングによるルールの抽出のほか、そのルールに対して、因果関係・相関関係などの意味づけを行う。
|
次年度の研究費の使用計画 |
次年度では、主に研究発表や報告に研究費を使用する予定であり、国際会議などに参加する予定である。この費用を外国旅費として計上する。 また、実験結果の解釈のために被験者をアルバイトとして雇う予定である。その費用を謝金として計上する。また、本研究による成果を論文誌などへ投稿するための費用や論文構成費を研究成果投稿料として謝金やその他に計上する。
|