本研究は内容に基くWeb文書の分類を可能とする文書システムの構築を目標としていた。従来用いられているキーワードの出現頻度に基づく「内容」と我々が認識する内容との間のギャップは大きいため本研究ではシステムに機械的に内容を判断させる方針を断念した。その代わりに人間が文書の分類を行うことを前提として研究を進めた。システムは分類情報の定義と交換を行う機能を提供し、ユーザが漸進的に分類を拡張することを可能とすることを目指した。 我々は分類情報をシステムを構成するコンポーネントとして捉えた。以下、これらを分類コンポーネントと呼ぶ。分類コンポーネントは内容を特徴付けるキーワードとそれらが文書内で果たす役割を定義する。キーワードの役割のパターンによって分類を行う。このアイデアは大澤のKeyGraphの研究からヒントを得たものである。分類コンポーネントは他のコンポーネントを参照することによりより複雑な分類を表現することが可能である。これは既存の分類情報の再利用という目的のために必ず必要な機能であるが、当初は予期していなかっ問題を引き起こす要因となった。一般にユーザは文書を複数の異なる視点で分類を行う。システム上ではこれは同じ分類コンポーネントが違う目的(コンテクスト)で共有されることを意味する。共有されるコンポーネントの内部データ(主にユーザからのフィードバック)に対する一つのコンテクストでの更新が別のコンテクストで好ましからざる影響を引き起こすからである。調査の結果こうした共有コンポーネントの問題は未だ有効な解決方法が無いことが判明した。本研究ではこの問題を主として取り組み、本研究ではシステムの構築にこそ至らなかったがOOAD的なアプローチによる解決が有効であることを示すことができた。
|