研究課題/領域番号 |
15K00314
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 千葉商科大学 |
研究代表者 |
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
研究分担者 |
白田 由香利 学習院大学, 経済学部, 教授 (30337901)
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
チャクラボルティ バサビ 岩手県立大学, ソフトウェア情報学部, 教授 (90305293)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2017年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2016年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2015年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | データマイニング / 東日本大震災 / 二部グラフ / 話題抽出 / クラスタリング / 知識発見 / 著者の役割 / ソーシャルメディア解析 / ビックデータ解析 / ツイッター解析 / 特徴抽出 / 2部グラフ解析 / 時系列話題抽出 / ビッグデータ解析 |
研究成果の概要 |
本研究では東日本大震災後に投稿された2 億件に及ぶTwitter データを対象とし,発言者の役割を反映した時系列話題解析とその評価を行った.発言者と単語の関係を2 部グラフで表し,発言者グループを抽出し,それを反映したクラスタリングを行うことで発言者の役割を推定し,解析精度を向上する手法を開発した.アルゴリズムはランダムウォークにより乱択化し,大規模データへの対応も行った.結果として,30分(あるいは1時間)ごとの投稿者と単語の二部グラフを生成し,そのデータに提案手法を適用することで,LDA等の従来手法より精度の高い話題を抽出することが可能であると確認できた.
|