研究課題/領域番号 |
23500299
|
研究機関 | 九州大学 |
研究代表者 |
伊東 栄典 九州大学, 情報基盤研究開発センター, 准教授 (90294991)
|
キーワード | 国際情報交換 |
研究概要 |
爆発的に増加する利用者参加型メディア内のコンテンツから,求めるコンテンツを探すには,コンテンツの品質(面白さ)評価尺度と,コンテンツのカテゴリ分類が必要である。この二つを,視聴者・読者がコンテンツへ付与するコメントやタグなどの情報を解析した集合知解析で実現する。2012年度は,オンライ小説「小説を読もう」を対象に研究した。 【データ収集】2ヶ月毎に全小説のメタデータ(題名,作者,投稿日,説明文,キーワード)と,全登録ユーザのお気に入り(ブックマーク)データを収集した。前年度に引き続き,ニコニコ動画のメタデータも収集した。収集の際は,前年度に導入したクラウドシステムを利用した。 【品質評価尺度】リンク構造解析を行う手法を提案した。読者のお気に入り情報からコンテンツと読者を結ぶ二部グラフを構築する。最初にリンク構造を統計的に調査した。次に二部グラフにHITSアルゴリズムを援用する手法を開発した。HITSとは反復回数や初期値の部分が異なる。これにより,将来人気になるコンテンツを予測する手法を実現した。 【カテゴリ分類手法】小説の作者が付与するキーワードを用いたカテゴリ分類手法を検討した。全小説データを合わせることで,集合知として扱う分類を試みた。最初に,コンテンツメタデータの多面的分析(facet analysis)を行うシステムを開発した。次に,頻度と共起頻度から小説キーワードを階層化する手法を適用し,それによる自動カテゴリ分類を試みた。最後に,小説のキーワードの出現頻度を投稿日でプロットし,流行を分析するツールを構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では最初の2年で(a),(b),(c)を,3年目に(d),(e)を行う予定であった。(a) 集合知データ収集,(b) 品質評価尺度の提案と評価,(c) カテゴリ分類手法の提案と評価,(d) 動画以外のコンテンツへの提案手法の適用,(e) 外部ソーシャルサービスからのタグおよびコンテンツ評価コメントの収集。 (a) 集合知データ収集:ニコニコ動画サイトの全メタデータを収集した。小説を読もうサイトの全メタデータと,全ユーザ情報を2ヶ月毎に収集した。今後も定期的収集が可能な体制を構築した。 (b) 品質評価尺度の提案と評価:「小説を読もう」サイトを対象に,将来人気なる小説を予測する手法を提案した。不人気(読者が少ない)ジャンルでは精度が高くないものの,読者が多い人気ジャンルでの精度が高い手法であることを示しており,良い品質評価になっている。2011年度に構築した感情表現語を使う方法と組合せれば,さらに精度の良い評価尺度になると思われる。 (c) の自動カテゴリ分類手法については進み具合が悪い。多面体解析,共起頻度による分類,人気ジャンルの推測を試みたものの,それらの結果は分かりやすいものになっていない。より斬新な手法を構築する必要がある。 最後に,(d) 動画以外のコンテンツへの提案手法の適用についても,既に動画ではないオンライン小説について適用を行なっており,当初予定よりも早く進んでいる。
|
今後の研究の推進方策 |
(a) 集合知データ収集については,従来どおり継続する。(b)品質評価尺度についての大きな研究は行わない。ジャーナル投稿するため,2011年度と2012年度に提案した手法をまとめる。まとめるために必要な再実験や,再実験および考察の中で出てくる修正は行う予定である。(d) 動画以外のコンテンツへの提案手法の適用は,既に行なっている。 2012年度は,本研究計画の中で最も進んでいない「(c)カテゴリ分類手法の提案と評価」を重点的に行う。従来から続けてきた統計的手法による分類手法を精査する。また,自然言語処理技術の援用も考える。動画や小説のメタデータの中で,簡単に扱えるキーワード・タグを主に対象とするだけでなく,作者が付与する説明文や,読者の感想コメント文を解析することも検討したい。 なお,申請時点で記載していた(e)外部ソーシャルサービスからのタグおよびコンテンツ評価コメントの収集は,行わない。この2年の間に各コンテンツサービスで,コメントやタグなどのソーシャル機能を充実することが出来ており,外部サイトから情報を取得する必要は無い。
|
次年度の研究費の使用計画 |
1人で行う研究であるため,大がかりな研究費使用計画ではない。物品として,老朽化した開発用ノートPCを更新するために購入する。また,クラウド機能を用いるためのタブレットを購入する。研究費の大部分は,研究成果発表に用いる。国際会議で発表と,国内会議での発表を合わせて3回以上行う予定である。
|