2013 Fiscal Year Annual Research Report
Project/Area Number |
23500299
|
Research Institution | Kyushu University |
Principal Investigator |
伊東 栄典 九州大学, 情報基盤研究開発センター, 准教授 (90294991)
|
Keywords | リンク構造 / ランキング / カテゴリ自動分類 / 動画コメント / 感情語分析 |
Research Abstract |
爆発的に増加する利用者参加型メディア内のコンテンツから,求めるコンテンツを探すには,コンテンツの品質(面白さ)評価尺度と,コンテンツのカテゴリ分類が必要である。この二つを,視聴者・読者がコンテンツへ付与するコメントやタグなどの情報を解析した集合知解析で実現する。2013年度はオンライン小説「小説を読もう」と中華圏の動画サイト「Bibibili動画」を対象に研究した。 【データ収集】小説データの新たな収集は行わなかった。昨年度までに収集した小説メタデータ(題名,作者,投稿日,説明文,キーワード)と,全登録ユーザのお気に入り(ブックマーク)データを収集用い,年度の前半に解析を行った。ニコニコ動画のデータについては,国立情報学研究所が提供を始めたため収集不要となった。2013年度から「bilibili動画」について,約100万件の動画メタデータを収集した。 【品質評価尺度】中華圏の動画サイト「bilibili動画」について,視聴者が動画に付与するコメントを解析して,動画の品質評価を行う手法を検討した。ネット用語の中国語の解析が不十分であるため,充分な品質評価尺度を提案できていない。小説の品質評価尺度についての研究は行っていない。前年度に開発した二部グラフのグラフ構造を用いたランキング手法についての,詳細評価は残ったままである。 【カテゴリ分類手法】小説作者が付与するキーワードを用いたカテゴリ分類手法を検討した。全小説データを使うことで集合知としての分類が可能である。2013年度は,前年度に引き続き,小説のキーワードの出現頻度を投稿日でプロットし,流行を分析するツールについての発表を行った。単語の出現頻度と共起頻度から,単語の上位語・下位語を定め,非循環有向グラフで意味階層を表現する概念グラフの手法を適用し,単語のクラスタ作成による自動分類を試みた。
|
Research Products
(4 results)