ルールベースの技術により論文データでは「比較」「問題点」「目的」「例」を記載必要項目として0.6から0.8のF値(性能)で記載の欠如を検出できた。技術を汎用化した。修正したい文書の類似文書を入力して、その文書での高頻度出現事項を重要事項として、その重要事項の記載の有無を発見する技術を構築した。単語レベルの情報抽出に基づき、8割程度のF値で欠落を検出できた。記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。文に基づいて情報抽出する技術を構築できた。新聞や製品情報の文書で、文レベルで記載の欠落を発見する実験を遂行できた。5割から8割程度のF値で欠落を発見できた。
|