2016 Fiscal Year Research-status Report
Project/Area Number |
26330252
|
Research Institution | Tottori University |
Principal Investigator |
村田 真樹 鳥取大学, 工学(系)研究科(研究院), 教授 (50358884)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 内容欠落文書の改善 / 文書推敲 / 記載必要項目 / 情報抽出 / 文生成 / 機械学習 |
Outline of Annual Research Achievements |
本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。 本年度は、言い換えと可視化の技術を用いて内容欠落文の記載を改善する記載支援技術の研究を行った。記載必要項目修正データベースに言い換え技術を利用することで、内容欠落文の改善のための文パターンや規則を獲得した。具体的には、論文における問題点と目的の記載が不十分な文章について修正するのに役立つ文パターンを獲得できた。また、内容欠落箇所に関わる情報をウェブなどから検索して執筆者に情報を提示し、執筆者が内容を考える参考とできる技術の開発を行った。具体的には、情報検索や質問応答技術を利用してこの研究を推進した。あるウィキペディアの記事において記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。 機械学習に基づく言語解析・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、意味解析に関わる研究を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本課題では、ある文書群において書くべき情報を情報抽出技術等を利用して特定し、その書くべき情報が記載されていない内容の欠落した文章を改善するのに必要となる技術を明らかにする。文章の種類ごとに書くべき項目(以降記載必要項目と呼ぶ)がある程度決まっている。新聞であれば5W1Hなどが、論文であれば研究対象・研究成果・必要性・有効性などが、面接用原稿であれば自分の能力とその根拠などが、記載必要項目となる。これらのことが書かれていなければ文章の説得力や可読性が低下する。本課題では、記載必要項目を好適に記述することを支援する技術を構築する。本課題の遂行には提案者の情報抽出と言い換えに関する成果と経験が役立つ。本課題はコミュニケーションの効率化に寄与する。 本年度は、言い換えと可視化の技術を用いて内容欠落文の記載を改善する記載支援技術の研究を行う予定であり、実際にその研究を行った。記載必要項目修正データベースに言い換え技術を利用することで、内容欠落文の改善のための文パターンや規則を獲得した。具体的には、論文における問題点と目的の記載が不十分な文章について修正するのに役立つ文パターンを獲得できた。また、内容欠落箇所に関わる情報をウェブなどから検索して執筆者に情報を提示し、執筆者が内容を考える参考とできる技術の開発を行った。具体的には、情報検索や質問応答技術を利用してこの研究を推進した。あるウィキペディアの記事において記載が欠落している個所に関わる情報をウェブから取得してユーザに提示する技術を構築した。以上のように、当初予定していた、記載を改善する記載支援技術の研究を遂行できた。 また、機械学習に基づく言語解析・文章作成支援など、文章の修正と情報欠落文書の分析に資する文章処理技術の検討も行った。例えば、文章修正技術、言い換え技術、意味解析に関わる研究を行った。
|
Strategy for Future Research Activity |
29年度に、技術の汎用化を行う。26年度から28年度に構築する、記載必要項目特定技術、記載確認技術、記載支援技術を、より多くの種類の文書でも使えるように技術の汎用化を行う。さらに、ある文書Aを入力すると、その文書と類似の種類の文書群をウェブなどから取得する技術も構築し、その文書群に対して、記載必要項目特定技術、記載確認技術、記載支援技術を利用して、文書Aでの内容欠落箇所の改善を好適に行う技術の研究を行う。この技術は、文書を入力すると、ほぼ自動的に、記載必要項目特定、記載確認、記載支援を一括して行うものであり、内容欠落文改善の効率化が飛躍的に向上する。この技術の有効性を確かめる被験者実験も行う。
|
Causes of Carryover |
28年度は、記載必要項目有無データベースと記載必要項目修正データベースを作成する予定であった。記載必要項目有無データベースには、記載必要項目が記載されているか否かを記した文章が格納される。記載必要項目無しの文章にはどういう記載必要項目の記載が欠けているかの 情報もつける。記載必要項目修正データベースには、記載必要項目を人手で書き足して修正した文章が格納される。試験的に小規模な記載必要項目有無データベースと記載必要項目修正データベースは作成したが、大規模なデータベースは研究をもう少し進めてからの方がよりよいデータベースが作成できると考え、一部データベースの作成を先延ばしにした。また学会発表も一部先延ばしにすることにした。これらにより、次年度使用額が発生した。
|
Expenditure Plan for Carryover Budget |
物品費を利用する。計算機、周辺機器、書籍など、研究活動を推進するために必要なものを購入する。旅費を利用する。26年度から28年度において行った研究の学会発表を行う。謝金、または、その他経費として、外注費を利用する。記載必要項目有無データベースと記載必要項目修正データベースを作成する。このデータベースは記載必要項目の記載の有無を自動判定する研究に必要である。データベースの作成作業は、謝金によるアルバイト、または、データ作成会社への外注により行う。 当初予定に比べて、29年度は学会発表、情報収集などの出張を多くする。研究をより推進しやすくできるように、データベースの拡充、質の向上を行う。このため、応募申請書提出時の予定より多くの研究費が必要となる予定である。28年度までの研究費の未使用分をこれに充当する。
|