研究概要 |
自治体や大学など,異なる業務部門の集まる複合組織内で,ネットワークに繋がった計算機上の共有データを統合し,その一覧性と検索性の強化を両立した新しいタイプのポータルの実現を目指し,そのために共有データ収集を少ないコストで効率的に行える収集システムの構築を行った. 共有データの収集には,多くの場合,共有データを管理するシステムの様式に合わせて,データを提供してもらう.しかしながら,通常と異なる様式に合わせる負担がデータ収集を妨げる要因となる.本研究では,組織内の非定型の共有データをそのまま提供してもらうだけで,共有利用に供する形式で蓄積するための方策を探って実現した.対象としたデータは,実施機関である大学での会議議事概要である.各部局,会議,あるいは作成者によって様々な形式が存在するこれら概要から自動的に,後の検索のための必須項目(会議名,開催日時,開催場所,出席者,欠席者)を抽出する方法を,概要の各行について必須項目毎に作成した決定木の利用により定式化した.抽出精度に関わる属性の設定は,必須項目ごとに行い,実用に耐えると考えられるレベルの精度を実験にて確認した.また,収集データを作成者が負担なく確認,修正できるインタフェースデザインを勘案し,実現した.抽出したデータのサーバへの蓄積とその検索の道筋も立てた. ここでのデータ抽出方法は,通常の業務内で生まれる組織内の共有データを,収集の負担を作成者に負わせずに行える利点を有し,他のデータ抽出システム構築にも活かすことが可能で,学内共有データ用のポータル実現に向けた足がかりとなる.
|