研究分担者 |
堀 浩一 東京大学, 先端科学技術研究センター, 教授 (40173611)
田中 克明 東京大学, 先端科学技術研究センター, 助教 (80376657)
加藤 義清 独立行政法人情報通信研究機構, 第二研究部門知識創生コミュニケーション研究センター, 研究員 (50373444)
大東 誠 東京大学, 大学院・情報学環, 助教 (40421995)
|
研究概要 |
本研究では,情報を伝達するための「物語」の重要性に着目し,文書(テキスト)における物語構造モデルを定義し,物語を構成する要素の関係に基づく文書の分節の基本的手法を提案することを目的としている。分節とは,区切ることによって関係を生じさせることであり,分節の具体的手法の研究開発は,既存の情報の粒度を変化させることにより,異なる関連を生み出し,文脈に応じて情報を再構成するために必要不可欠な技術である。本研究では,対象文書の中に出現する「語の依存度」と「語の吸引力」の概念を基にして,意味のある単位に文書を分解する手法を確立し,再構成するための文脈自身を探索しながら情報にアクセスすることを可能とする,ナラティブ連想情報アクセスのフレームワークを確立することを目的とする。 本年度は,物語生成フレームワークに基づく文節か技術を用いて,多量なテキストを組換え可能な粒度に分節し,多量なテキスト情報に横断的に埋没している多重文脈の抽出に主眼をおき,研究開発を行った。これにより,物語構造モデルに基づく話題類似連鎖構造の抽出や多重文脈間の相互作用に関する基礎研究を進めた。 また,文書の潜在的多重文脈の視覚化ツールとして,WordColony Topic Sequence,Topic Treeを統合し,歴史年表に視覚化を行い,この有効性を示した。
|