2004 Fiscal Year Annual Research Report
語の共起依存特性に基づく語彙連鎖を用いた連想的情報断片探索手法と応用に関する研究
Project/Area Number |
16700128
|
Research Institution | The University of Tokyo |
Principal Investigator |
赤石 美奈 東京大学, 先端科学技術研究センター, 助教授 (60273166)
|
Keywords | 語彙連鎖 / Word Colony / 共起 / 物語 / 連想的情報アクセス / 視覚化 |
Research Abstract |
本研究では、語彙連鎖に基づく文書主題の視覚化手法に関して研究を行い、文書中の語の共起関係の方向性に着目して、語群クラスターを形成し、これを視覚化するツールWord Colonyを開発した。各語の出現頻度を考慮した共起依存度を指標として用いることにより、(i)双方向に強い共起依存度を持つ語群・(ii)一方向にのみ強い共起依存度をもち共起に主従関係を生じる語群、(iii)互いに共起関係にない語群に分けられる。この共起依存度に基づく語彙クラスターの連鎖を用いて情報断片を連結し、語彙的連鎖の関係を視覚化する。つまり、語の共起依存の方向性に基づき、文書中の主要な語群と、互いに直接共起関係にないが、主要語群に共起依存する語群を抽出し、共起依存関係を表す語のコロニーを視覚化し、文書の内容を語と語の関係として表現するツールである。与えられたテキストをWord Colonyで視覚化し、文書の内容を俯瞰するグラフとして示すことにより、ユーザに、語彙連鎖に基づく想起を促し、得られた結果を体系的、構造的に捉え直し、比較対照を可能とするインタフェースを提供した。 また、本年度は、語彙連鎖に基づく文書の物語構造解析手法の研究も行い、非構造化文書を主題に基づき分割する手法の研究・開発に着手した。これにより、複数の文書の関連部分を横断的に探索し、多様な視点で情報を捉えるための連想的情報アクセス手法の外郭を具体化した。
|