• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

記述必要項目特定技術を利用した内容欠落文書の改善

研究課題

研究課題/領域番号 26330252
研究機関鳥取大学

研究代表者

村田 真樹  鳥取大学, 工学(系)研究科(研究院), 教授 (50358884)

研究期間 (年度) 2014-04-01 – 2018-03-31
キーワード内容欠落文書の改善 / 文書推敲 / 記載必要項目 / 情報抽出 / 文生成 / 機械学習
研究実績の概要

本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。
本年度は、言い換えと可視化の技術を用いて内容欠落文の記載を改善する記載支援技術の研究を行った。記載必要項目修正データベースに言い換え技術を利用することで、内容欠落文の改善のための文パターンや規則を獲得した。具体的には、論文における問題点と目的の記載が不十分な文章について修正するのに役立つ文パターンを獲得できた。また、内容欠落箇所に関わる情報をウェブなどから検索して執筆者に情報を提示し、執筆者が内容を考える参考とできる技術の開発を行った。具体的には、情報検索や質問応答技術を利用してこの研究を推進した。あるウィキペディアの記事において記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。
機械学習に基づく言語解析・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、意味解析に関わる研究を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。
本年度は、言い換えと可視化の技術を用いて内容欠落文の記載を改善する記載支援技術の研究を行う予定であり、実際にその研究を行った。記載必要項目修正データベースに言い換え技術を利用することで、内容欠落文の改善のための文パターンや規則を獲得した。具体的には、論文における問題点と目的の記載が不十分な文章について修正するのに役立つ文パターンを獲得できた。また、内容欠落箇所に関わる情報をウェブなどから検索して執筆者に情報を提示し、執筆者が内容を考える参考とできる技術の開発を行った。具体的には、情報検索や質問応答技術を利用してこの研究を推進した。あるウィキペディアの記事において記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。以上のように、当初予定していた、記載を改善する記載支援技術の研究を遂行できた。
また、機械学習に基づく言語解析・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、意味解析に関わる研究を行った。

今後の研究の推進方策

29年度に、技術の汎用化を行う。26年度から28年度に構築する、記載必要項目特定技術、記載確認技術、記載支援技術を、より多くの種類の文書でも使えるように技術の汎用化を行う。さらに、ある文書Aを入力すると、その文書と類似の種類の文書群をウェブなどから取得する技術も構築し、その文書群に対して、記載必要項目特定技術、記載確認技術、記載支援技術を利用して、文書Aでの内容欠落箇所の改善を好適に行う技術の研究を行う。この技術は、文書を入力すると、ほぼ自動的に、記載必要項目特定、記載確認、記載支援を一括して行うものであり、内容欠落文改善の効率化が飛躍的に向上する。この技術の有効性を確かめる被験者実験も行う。

次年度使用額が生じた理由

28年度は、記載必要項目有無データベースと記載必要項目修正データベースを作成する予定であった。記載必要項目有無データベースには、記載必要項目が記載されているか否かを記した文章が格納される。記載必要項目無しの文章にはどういう記載必要項目の記載が欠けているかの 情報もつける。記載必要項目修正データベースには、記載必要項目を人手で書き足して修正した文章が格納される。試験的に小規模な記載必要項目有無データベースと記載必要項目修正データベースは作成したが、大規模なデータベースは研究をもう少し進めてからの方がよりよいデータベースが作成できると考え、一部データベースの作成を先延ばしにした。また学会発表も一部先延ばしにすることにした。これらにより、次年度使用額が発生した。

次年度使用額の使用計画

物品費を利用する。計算機、周辺機器、書籍など、研究活動を推進するために必要なものを購入する。旅費を利用する。26年度から28年度において行った研究の学会発表を行う。謝金、または、その他経費として、外注費を利用する。記載必要項目有無データベースと記載必要項目修正データベースを作成する。このデータベースは記載必要項目の記載の有無を自動判定する研究に必要である。データベースの作成作業は、謝金によるアルバイト、または、データ作成会社への外注により行う。
当初予定に比べて、29年度は学会発表、情報収集などの出張を多くする。研究をより推進しやすくできるように、データベースの拡充、質の向上を行う。このため、応募申請書提出時の予定より多くの研究費が必要となる予定である。28年度までの研究費の未使用分をこれに充当する。

  • 研究成果

    (6件)

すべて 2017 2016

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 2件) 学会発表 (4件) (うち国際学会 2件)

  • [雑誌論文] Correcting Redundant Japanese Sentences Using Patterns and Machine Learning for the Development of Writing Support Systems2016

    • 著者名/発表者名
      Masaki Murata, Shunsuke Tsudo, Masato Tokuhisa, Qing Ma
    • 雑誌名

      International Journal of Computational Linguistics and Applications

      巻: Vol. 7, No. 2 ページ: 183-199

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Sense Disambiguation in Usages of Japanese Locational Expressions2016

    • 著者名/発表者名
      Masaki Murata, Masahiro Kojima, Ryo Nishimura, Shoki Nishimura and Yasuhiko Watanabe
    • 雑誌名

      Information: An International Interdisciplinary Journal

      巻: Vol. 19, No. 6 ページ: 1977-1990

    • 査読あり / 謝辞記載あり
  • [学会発表] 論文における記載不備の自動修正に向けた分析2017

    • 著者名/発表者名
      岡田拓真, 村田真樹, 馬青
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      茨城県つくば市、筑波大学
    • 年月日
      2017-03-14 – 2017-03-16
  • [学会発表] 検索エンジンを用いた記載欠落箇所の補完2017

    • 著者名/発表者名
      野浪尚哉, 村田真樹, 馬青
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      茨城県つくば市、筑波大学
    • 年月日
      2017-03-14 – 2017-03-16
  • [学会発表] Automatic Detection and Manual Analysis of Inadequate Descriptions in a Thesis2016

    • 著者名/発表者名
      Takuma Okada, Masaki Murata and Qing Ma
    • 学会等名
      2016 Joint 8th International Conference on Soft Computing and Intelligent Systems and 2016 17th International Symposium on Advanced Intelligent Systems
    • 発表場所
      北海道札幌市、北海学園大学
    • 年月日
      2016-08-25 – 2016-08-28
    • 国際学会
  • [学会発表] Japanese Word Sense Disambiguation Using Paraphrasing and Machine Learning2016

    • 著者名/発表者名
      Yuma Toda, Masaki Murata and Qing Ma
    • 学会等名
      2016 Joint 8th International Conference on Soft Computing and Intelligent Systems and 2016 17th International Symposium on Advanced Intelligent Systems
    • 発表場所
      北海道札幌市、北海学園大学
    • 年月日
      2016-08-25 – 2016-08-25
    • 国際学会

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi