研究課題/領域番号 |
24500119
|
研究機関 | 九州大学 |
研究代表者 |
牛尼 剛聡 九州大学, 芸術工学研究科(研究院), 准教授 (50315157)
|
キーワード | 電子書籍 / インタフェース / 立ち読み / 可視化 / データマイニング / ブラウジング |
研究概要 |
「立ち読み」は書籍選別に有効な手段である.これまでにも,ユーザのクエリにもとづいて効果的な選別を行う手法は提案されているが,未読の小説においては,ユーザは小説本文に含まれるキーワードをクエリとして指定することは困難である.本研究ではでは,Web上で閲覧できる電子化された小説を対象とし,「立ち読み」を始める箇所の効率的発見を支援するインタフェースを開発した.本インタフェースでは,小説の選別においては,小説の内容に興味をひかれるかどうかが重要と考え,「物語の進行における興味をひく度合いの推移」を可視化した興味喚起度マップを利用する.興味喚起度マップでは,ユーザの興味をひく度合いが高い単語が密に出現する箇所が,ユーザの興味をひく度合いが高いと考え,単語の興味をひく度合いは,小説のレビューを用いて推定する.興味喚起度マップは,層構造を持ち,上位の層は全体像の把握ために利用し,下位の層は詳細な内容の把握のために利用する.本インタフェースでは,ユーザが興味喚起度マップ上の単語をクリックすることによって,効率的に「立ち読み」を行うことができる.被験者による実験によって,本インタフェースを利用した「立ち読み」によって,Webブラウザを用いた「立ち読み」よりも,電子化された小説を効果的に選別できることが示された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
我々が開発した電子化小説選別インタフェースは,興味喚起度マップを基盤としている.興味喚起度マップは,「物語の進行」に伴った,「ユーザの興味を喚起する度合い」の推移をグラフで可視化した図である.層のピーク箇所には,その箇所において特徴的であり,興味をひくと予想される単語が配置される.興味喚起度マップを利用することで,ユーザが興味をひく可能性が高い箇所を,「立ち読み」を開始する箇所として効率的に選択することを支援する. 興味喚起度マップを生成するために,最初に,小説本文に出現する単語の興味喚起度を,Web上に存在する小説のレビューを使って推定する.ここでは,対象とする小説のレビューに出現する頻度が高く,他の小説のレビューの出現頻出が低い単語に高い興味喚起度を与える.次に,小説の流れに従った興味喚起度の推移を可視化する.これにより,ユーザは興味を喚起する文章に出会う可能性が高い箇所を知ることができる.しかし,小説の流れに沿った興味喚起度の推移だけでは,そこにどのような内容が書かれているのかが解らない.そこで,最後に,それぞれの層のピーク箇所に特徴的なキーワードを決定し,配置する. 提案インタフェースの有効性を示すために,被験者実験に基づく評価を行った.我々は,各観点から確信を持った判断を下せるインタフェースは,より有効性が高いと考え,読みたい小説かどうかを,確信をもって選択できたかという観点から提案インタフェースを評価した.評価のためのベースラインとして,青空文庫のWebサイト上での書籍閲覧を利用した.提案インタフェースを用いることで,「読みたい小説かどうか」,「小説の話の筋が魅力的かどうか」,「小説の登場人物が魅力的かどうか」について,確信を持った判断が可能であることがわかった.また,マン・ホイットニーのU検定により,これらには有意水準1%で有意差があることが示された.
|
今後の研究の推進方策 |
これまでの研究により,電子書籍小説の本文のテキストとオンラインレビューを用いて,電子書籍小説を読みたいかどうかを効率的に確信を持って判断できるインタフェースを開発した.しかし,電子書籍の選別の際には,本文の概要だけではなく,いくつかの書籍の候補の中から,特定の書籍を選別する必要がある.この際に,書籍の特徴を明確化することが重要であると考える.この視点に基づいて,今後は,複数の候補の特徴をユーザにわかりやすく提示することにより,電子書籍の選別を支援する手法を開発する. 具体的には,ユーザが複数のコンテンツから,それらの特徴を踏まえて,一つを選別する行為を支援することを目的として,コンテンツ集合内の要素を比較したときの差異に注目し,それを明確化することで,コンテンツ選別のヒントを与える手法を開発する.具体的には,ユーザが指定した比較対象とするコンテンツのペアに対して,それらの共通要素を除外したもの,つまり二つの差異となる要素を,それぞれのペアとしての特徴とする.そして,差異の特徴類に関する類似度が高いコンテンツのペアを,ユーザに「たとえ」として提示する.そのために,まず,「たとえ」の候補となるペアをコンテンツ集合から選出する.「たとえ」の候補となるペアは,ペアどうしが同じジャンルやテーマを持つなど,大きな共通要素を持っていることが望ましい.そのために,コンテンツ集合において各コンテンツの文書ベクトルの類似度が高いもののみを「たとえ」の候補とする. 次に,比較する二つのコンテンツにおける差異特徴ベクトルを生成したものと同様の操作を,「たとえ」の候補となるコンテンツ集合から作り得る全てのペアに対しても行い,差異特徴ベクトルを上記で定義した式によって,類似度を計算し,その値が最も高いペアを,コンテンツペアの差異に最も近い差異を持つペアとして,ユーザに提示することを考える.
|