研究課題/領域番号 |
16K16154
|
研究機関 | 筑波大学 |
研究代表者 |
伏見 卓恭 筑波大学, 図書館情報メディア系, 特別研究員(PD) (80755702)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 評価文書 / 時系列文書 / 可視化 / 極座標平面 |
研究実績の概要 |
本年度の核となる課題は,要点と評価を考慮した評価文書の可視化法の確立である.レビューサイトなどから得られるデータ(商品,ユーザ,ユーザの商品に対するスコアおよびコメント文)を対象に,スコアとコメント文から抽出する評価観点を軸とし,極座標平面上にレビューをプロットする手法を確立した.応募者の既存手法をベースにコメント文と文中に出現する単語からなる二部グラフを構築し,提案した目的関数を最大にするように各ノード(コメント文と単語)の最適配置を決定する.これにより,類似の単語から構成される,すなわち,類似の観点で評価されたコメント文は,原点からみて同一方向にプロットされるようになる.逆に,異なる単語から構成されるコメント文は,原点からみて異なる方向にプロットされる.さらに,スコアにより原点からの距離(半径)を決定する.実レビューサイトのデータに適用し,提案手法の有効性を評価し,人工知能学会の全国大会で発表した.この手法を拡張し,ニュース記事やブログ記事のような時系列文書(文書ストリーム)を効果的に可視化する手法を提案した.横軸に時間軸をとる多くの従来手法では,時間が経つにつれて各トピックに含まれる文書数が多くなるような時系列文書を可視化する際,右に行くに連れ文書数が多くなってしまい,効果的な可視化結果を得られない傾向にあった.応募者の提案手法では,半径を時間軸とした極座標平面上に文書群をプロットするため,時間が経つにつれて文書数が増加しても,描画領域も広くなるため,効果的な可視化を実現できる.実際のニュース記事群を用いた評価実験により,提案手法の有効性を示し,データ工学と情報マネジメントに関するフォーラムにおいて発表した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本研究課題は,評価文書を効果的に可視化することで,ユーザ所望の評価文書への効果的なアクセスを実現するというものである.この目的のために提案した可視化手法を拡張し,時系列文書の効果的な可視化手法を提案することができたため,当初の計画以上に進展していると評価できる.さらに,大規模なデータの効果的な可視化に不可欠である次元圧縮手法として,クラスタリング手法が挙げられるが,K-medoids法の高速化など,関連する課題についても着手できた.これらの研究成果を国内の全国大会や研究会だけでなく,国際会議,さらには論文誌掲載にまで至ったため,このような評価とした.
|
今後の研究の推進方策 |
昨年度までの評価文書可視化では,レビューのスコアをそのまま半径として用いて極座標平面上に可視化している.しかし,レビューしたユーザによって各スコアの意味は異なる.すなわち,レビュアーの中には専門的な知識を有する者もいれば,偏ったスコアしかつけないレビュアーも存在する.そのような点を考慮した可視化結果を出力するために,各レビュアーの専門性を表す指標を提案する.具体的には,応募者の既存手法であるカテゴリ選択モデルを用いて,レビュアーが当該商品,あるいは,当該商品が属するカテゴリについてどの程度専門性を有するか,ロイヤルティがどの程度あるかを算出し,スコアに加味する. レビュアーの評点の偏り傾向算出に関してはジニ係数を算出し,レビュアーのある商品への評点がそのレビュアーにとってどの程度ポジティブな点数なのかネガティブな点数なのかを算出する.これは,レビュアーによって異なる評価の意味を正規化する役割を果たす.
|
次年度使用額が生じた理由 |
論文誌の掲載が2017年度であるため.
|
次年度使用額の使用計画 |
論文誌の投稿掲載料に使用する.
|