研究概要 |
領域共通の肝炎データに対して,実際に動作する前処理支援システムの構築を進めている.今年度は,データ構造として採用している木構造の機能について解析を行うと同時に,データ変形フィルタを整備した.また,処理ステップ数をデータベースのクエリーによる前処理などの従来の手法と比較した.手順を自動獲得する機構を試作し,評価も行った.情報収集および前処理は,情報提供者,ドメイン専門家,マイニング専門家の共同作業になることがほとんどで,それらの間で大量のデータが交換され,更新が頻繁に行われることに特徴がある.このような共同作業を支援するため,通常,メールとWebページが用いられるが,不便な点が多い.これを解決する一つの方法として,伝言ゲーム型の情報収集および前処理結果の交換を提案してきた.今年度は,昨年度版を詳細に吟味し,プッシュ型の情報交換,コメントの一元的保持,ユーザ独自に設定できる階層化カテゴリー,コメント交換過程の可視化表示機能を導入した.ユーザインタフェースも一新したので,使い勝手がかなり向上したと考えている.コメントを一元的に保持したことから,ユーザへの記事の推薦精度も向上した.情報伝達や前処理過程への優先順位付けの考え方をさらに拡張して,決定木の構築過程で各属性の優先順位を制御する実験を行った.MEDLINEデータベースでの単語の出現回数や過去の知識に基づいて重み付けを行い,肝炎データから決定木を生成したところ,従来得られなかった知識が得られ,専門の医師から高い評価が得られた.これにより,情報収集とマイニングの連携に寄与できた.
|