XMLなどの半構造データに関し、特に地球科学データ、論文および発表資料に着目して、データを検索、管理する際のデータ管理者およびデータ利用者に対する理解支援に関する研究を行った。XML文書に対するキーワード検索として、XML文書中の文書指向の部分、データ指向の部分を意識した検索結果の取得を行う手法を提案し、XML化した論文のデータを用いて実験を行い、有用性を議論した。地球科学データに関しては、データに関連する論文を提示することでデータ理解支援ができると考え、実際のデータセットと論文の対応付け事例を調査して、メタデータを介して論文と対応付けるための手法の検討を進めた。また、データの検索・俯瞰に重要であるメタデータ中のキーワード情報に着目し、付与すべきキーワードを推測するための手法および、キーワードを利用した俯瞰手法を考案した。論文および発表資料に関しては、プレゼンテーションスライドから構成を抽出する手法を議論し、関連する論文間および論文とそれに対応するプレゼンテーションスライド間での細粒度対応付け手法を考案した。論文における段落やプレゼンテーションスライドにおける各スライドを単位として、部分的な対応を得ることで、差分の把握や、対応部分閲覧による理解補助が可能であると思われる。実際に小規模なデータセットを用いて対応付け実験を行い、人手で判定した結果と比較して議論を行った。文書順および構造情報を利用することにより対応付け精度の改善を行うことができた。
|