2018 Fiscal Year Annual Research Report
Improvement of content missing documents using description required item identification technology
Project/Area Number |
26330252
|
Research Institution | Tottori University |
Principal Investigator |
村田 真樹 鳥取大学, 工学研究科, 教授 (50358884)
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Keywords | 内容欠落文書の改善 / 文書推敲 / 記載必要項目 / 情報抽出 / 文生成 / 機械学習 |
Outline of Annual Research Achievements |
本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。 本年度は、単語レベルで行っていたものを文レベルに拡張した。前年度までは、単語レベルで情報を抽出し、情報の洩れを指摘していたが、本年度は、文レベルで情報を抽出し、情報の洩れを指摘する研究を行った。新聞や製品情報の文書で、記載の欠落を発見する実験を遂行できた。実験を行った結果、F値において8割程度で情報抽出し、漏れの検出を5割から8割のF値で行えた。 機械学習に基づく言語解析・情報抽出・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、文章解析技術、情報抽出に関わる研究を行った。 情報抽出の研究では、文に基づいて情報抽出する技術の高度化も遂行した。
|