2006 Fiscal Year Annual Research Report
時系列文書からの主題変化の抽出と利用目的に応じた動的再構成
Project/Area Number |
17700136
|
Research Institution | The University of Tokyo |
Principal Investigator |
田中 克明 東京大学, 先端科学技術研究センター, 助手 (80376657)
|
Keywords | 主題抽出 / 知識獲得 / 情報可視化 / テキストセグメンテーション / 設計支援 |
Research Abstract |
本研究においては、長期間にわたって蓄積された問題解決記録を対象とし、記述されている対象間の時間経過にともなう関係変化についての情報を抽出することと、その情報の構造を利用局面に応じて再構成することを目指している。 長期間に渡って蓄積された問題解決記録は、その量が多いために、全貌、すなわちどのような主題から構成されているか、を把握することは容易ではない。また、問題解決期間中に、主として取り上げられる主題の変化や、さらにその主題間の関係変化がおこるために、時間の経過に注目して、内容を把握する必要がある。 そこで、文書群をある時点までごとの複数の文書群に分割し、これをクラスタリングによって分類し、時間的に隣接する文書群から作られたクラスタ間の相関を計量することにより、主題候補と、その変化の抽出を行った。 今年度はさらに、新たな言及がなされていない主題の重みを、時間経過にともなって減少させることにより、主題が忘却されていく過程を主題の遷移構造の中に組み込んだ。その上で、本研究で実装したシステムの操作者が着目した複数の語を指定させることにより、主題遷移の構造を再構成し、ユーザ視点に基づいた情報の提示をおこなう機能、主題に含まれる特定の設計対象に着目し、対象への操作を示す語を取り出すことにより、設計プロセスを提示する機能の研究を行った。 以上により、大量の文書中に蓄積された情報を俯瞰することのみならず、ユーザの意図に基づいて主観的に再構成することが可能となった。すなわち、情報を漠然と眺めるのではなく、知りたいことを、情報全体の中での位置付けとともに、知ることができるようになった。
|