2018 Fiscal Year Annual Research Report
Construction and evaluation of multilingual document authoring frameworks based on the combination of document structures and linguistic expressions
Project/Area Number |
17H06733
|
Research Institution | Nagoya University |
Principal Investigator |
宮田 玲 名古屋大学, 工学研究科, 助教 (70804300)
|
Project Period (FY) |
2017-08-25 – 2019-03-31
|
Keywords | 文書構造化 / 制限言語 / 文書品質評価 / 機械翻訳応用 |
Outline of Annual Research Achievements |
本研究の目的は、効果的な情報伝達を可能とする文書構造と言語表現を解明し、機械翻訳システムを用いた多言語文書作成方式を構築・検証することである。昨年度自治体文書に対して行った研究に基づき、今年度は自動車関連の技術文書を対象に以下の研究を進めた。 ・文書構造の定式化:自動車の修理手続きに関する文書を対象に、どのような内容がどのような順序で配置されているかを整理した。文書に書かれている内容を抽象化したコード(内容要素)を、最小単位を節として、対象テキストに手作業で付与した。合計2907個のテキストスパンに対して割り当てられたコードは、26種類の内容要素にまとまった。さらに内容要素を文書規格DITAにマッピングすることで、文書構造の定式化を行った。 ・文書品質の評価:構築した文書構造規格が、実際の読み手の理解を促進するものであるかを、ユーザ評価により検証した。文書構造規格による書き換え前と書き換え後の文書を用いて、人間の文書読解プロセスを分析した。 ・文書構造と言語表現の対応づけ:内容要素の自動分類器を作成し、約16万文のテキストデータを対象に、内容要素ごとの言語表現を収集した。 ・制限言語スタイルガイドの作成:読みやすさと(機械)翻訳しやすさの向上のために、構文・語彙・表記レベルで望ましい(あるいは望ましくない)表現パターンを明文化したルール集の作成を進めた。複雑な構文や曖昧な表現を規制するルールを10カテゴリーにわたり約150種類作成した。
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|
Research Products
(5 results)