本研究の目的は、効果的な情報伝達を可能とする文書構造と言語表現を解明し、機械翻訳システムを用いた多言語文書作成方式を構築・検証することである。昨年度自治体文書に対して行った研究に基づき、今年度は自動車関連の技術文書を対象に以下の研究を進めた。 ・文書構造の定式化:自動車の修理手続きに関する文書を対象に、どのような内容がどのような順序で配置されているかを整理した。文書に書かれている内容を抽象化したコード(内容要素)を、最小単位を節として、対象テキストに手作業で付与した。合計2907個のテキストスパンに対して割り当てられたコードは、26種類の内容要素にまとまった。さらに内容要素を文書規格DITAにマッピングすることで、文書構造の定式化を行った。 ・文書品質の評価:構築した文書構造規格が、実際の読み手の理解を促進するものであるかを、ユーザ評価により検証した。文書構造規格による書き換え前と書き換え後の文書を用いて、人間の文書読解プロセスを分析した。 ・文書構造と言語表現の対応づけ:内容要素の自動分類器を作成し、約16万文のテキストデータを対象に、内容要素ごとの言語表現を収集した。 ・制限言語スタイルガイドの作成:読みやすさと(機械)翻訳しやすさの向上のために、構文・語彙・表記レベルで望ましい(あるいは望ましくない)表現パターンを明文化したルール集の作成を進めた。複雑な構文や曖昧な表現を規制するルールを10カテゴリーにわたり約150種類作成した。
|