• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

記述必要項目特定技術を利用した内容欠落文書の改善

Research Project

Project/Area Number 26330252
Research InstitutionTottori University

Principal Investigator

村田 真樹  鳥取大学, 工学(系)研究科(研究院), 教授 (50358884)

Project Period (FY) 2014-04-01 – 2018-03-31
Keywords内容欠落文書の改善 / 文書推敲 / 記載必要項目 / 情報抽出 / 文生成 / 機械学習
Outline of Annual Research Achievements

本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。
本年度は、言い換えと可視化の技術を用いて内容欠落文の記載を改善する記載支援技術の研究を行った。記載必要項目修正データベースに言い換え技術を利用することで、内容欠落文の改善のための文パターンや規則を獲得した。具体的には、論文における問題点と目的の記載が不十分な文章について修正するのに役立つ文パターンを獲得できた。また、内容欠落箇所に関わる情報をウェブなどから検索して執筆者に情報を提示し、執筆者が内容を考える参考とできる技術の開発を行った。具体的には、情報検索や質問応答技術を利用してこの研究を推進した。あるウィキペディアの記事において記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。
機械学習に基づく言語解析・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、意味解析に関わる研究を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。
本年度は、言い換えと可視化の技術を用いて内容欠落文の記載を改善する記載支援技術の研究を行う予定であり、実際にその研究を行った。記載必要項目修正データベースに言い換え技術を利用することで、内容欠落文の改善のための文パターンや規則を獲得した。具体的には、論文における問題点と目的の記載が不十分な文章について修正するのに役立つ文パターンを獲得できた。また、内容欠落箇所に関わる情報をウェブなどから検索して執筆者に情報を提示し、執筆者が内容を考える参考とできる技術の開発を行った。具体的には、情報検索や質問応答技術を利用してこの研究を推進した。あるウィキペディアの記事において記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。以上のように、当初予定していた、記載を改善する記載支援技術の研究を遂行できた。
また、機械学習に基づく言語解析・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、意味解析に関わる研究を行った。

Strategy for Future Research Activity

29年度に、技術の汎用化を行う。26年度から28年度に構築する、記載必要項目特定技術、記載確認技術、記載支援技術を、より多くの種類の文書でも使えるように技術の汎用化を行う。さらに、ある文書Aを入力すると、その文書と類似の種類の文書群をウェブなどから取得する技術も構築し、その文書群に対して、記載必要項目特定技術、記載確認技術、記載支援技術を利用して、文書Aでの内容欠落箇所の改善を好適に行う技術の研究を行う。この技術は、文書を入力すると、ほぼ自動的に、記載必要項目特定、記載確認、記載支援を一括して行うものであり、内容欠落文改善の効率化が飛躍的に向上する。この技術の有効性を確かめる被験者実験も行う。

Causes of Carryover

28年度は、記載必要項目有無データベースと記載必要項目修正データベースを作成する予定であった。記載必要項目有無データベースには、記載必要項目が記載されているか否かを記した文章が格納される。記載必要項目無しの文章にはどういう記載必要項目の記載が欠けているかの 情報もつける。記載必要項目修正データベースには、記載必要項目を人手で書き足して修正した文章が格納される。試験的に小規模な記載必要項目有無データベースと記載必要項目修正データベースは作成したが、大規模なデータベースは研究をもう少し進めてからの方がよりよいデータベースが作成できると考え、一部データベースの作成を先延ばしにした。また学会発表も一部先延ばしにすることにした。これらにより、次年度使用額が発生した。

Expenditure Plan for Carryover Budget

物品費を利用する。計算機、周辺機器、書籍など、研究活動を推進するために必要なものを購入する。旅費を利用する。26年度から28年度において行った研究の学会発表を行う。謝金、または、その他経費として、外注費を利用する。記載必要項目有無データベースと記載必要項目修正データベースを作成する。このデータベースは記載必要項目の記載の有無を自動判定する研究に必要である。データベースの作成作業は、謝金によるアルバイト、または、データ作成会社への外注により行う。
当初予定に比べて、29年度は学会発表、情報収集などの出張を多くする。研究をより推進しやすくできるように、データベースの拡充、質の向上を行う。このため、応募申請書提出時の予定より多くの研究費が必要となる予定である。28年度までの研究費の未使用分をこれに充当する。

  • Research Products

    (6 results)

All 2017 2016

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Acknowledgement Compliant: 2 results) Presentation (4 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Correcting Redundant Japanese Sentences Using Patterns and Machine Learning for the Development of Writing Support Systems2016

    • Author(s)
      Masaki Murata, Shunsuke Tsudo, Masato Tokuhisa, Qing Ma
    • Journal Title

      International Journal of Computational Linguistics and Applications

      Volume: Vol. 7, No. 2 Pages: 183-199

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Sense Disambiguation in Usages of Japanese Locational Expressions2016

    • Author(s)
      Masaki Murata, Masahiro Kojima, Ryo Nishimura, Shoki Nishimura and Yasuhiko Watanabe
    • Journal Title

      Information: An International Interdisciplinary Journal

      Volume: Vol. 19, No. 6 Pages: 1977-1990

    • Peer Reviewed / Acknowledgement Compliant
  • [Presentation] 論文における記載不備の自動修正に向けた分析2017

    • Author(s)
      岡田拓真, 村田真樹, 馬青
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      茨城県つくば市、筑波大学
    • Year and Date
      2017-03-14 – 2017-03-16
  • [Presentation] 検索エンジンを用いた記載欠落箇所の補完2017

    • Author(s)
      野浪尚哉, 村田真樹, 馬青
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      茨城県つくば市、筑波大学
    • Year and Date
      2017-03-14 – 2017-03-16
  • [Presentation] Automatic Detection and Manual Analysis of Inadequate Descriptions in a Thesis2016

    • Author(s)
      Takuma Okada, Masaki Murata and Qing Ma
    • Organizer
      2016 Joint 8th International Conference on Soft Computing and Intelligent Systems and 2016 17th International Symposium on Advanced Intelligent Systems
    • Place of Presentation
      北海道札幌市、北海学園大学
    • Year and Date
      2016-08-25 – 2016-08-28
    • Int'l Joint Research
  • [Presentation] Japanese Word Sense Disambiguation Using Paraphrasing and Machine Learning2016

    • Author(s)
      Yuma Toda, Masaki Murata and Qing Ma
    • Organizer
      2016 Joint 8th International Conference on Soft Computing and Intelligent Systems and 2016 17th International Symposium on Advanced Intelligent Systems
    • Place of Presentation
      北海道札幌市、北海学園大学
    • Year and Date
      2016-08-25 – 2016-08-25
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi