研究実績の概要 |
最終年度である平成29年度は,次のようなテーマを重点的に推進した. 1. 校正英文対の収集と処理方式の策定:日本人の書いた研究会英文概要を科学論文の校正者によって校正を施し,校正英文対を蓄積した.最近の英文校正は,Microsoft Word(以後,Word)の変更履歴機能を利用することが多い.構文変化を計算する際,この変更履歴も利用することした.その結果,校正が加えられない箇所については構造が変化しないため,大幅に計算量が削減される. 2. 校正英文対から構文変化情報付き構文構造を算出するプログラム作成と公開:Wordの変更履歴機能を利用した校正英文対を与えると,その変更履歴も利用し,Stanford Parserが出力する構文解析結果に基づいた構文変化情報付き構文構造を出力するプログラムを作成し,Web上で公開した.インターネットにアクセスできる環境にあれば利用できる. 3. 構文変化情報付き構文コーパスの構築と公開の検討:1と2で作成した校正英文対と構文変化情報付き構文構造コーパスを構築した.サイズは1,294文対で延べ語数は53,488語である.公開にあたって当面は構文レベルの分析を念頭とし,語部分をすべてマスクしたかたちで行うこととした.今後,研究目的やニーズに応じて,個人等が特定できない範囲で語を残したかたちも検討する. 4. 構文変化の基本的分析:3で述べたコーパスに対して,さまざまな句構造での構文変化状況を分析した.対象となる句構造の延べ数は75,883で,同じ文法範疇でも部分的な構文構造を参照することで,より細かな校正状況を明らかとすることができる.たとえば,同じ名詞句でも文法役割が主語か目的語かによって,校正の割合が大きく変わる.その他,動詞句・前置詞句に対する分析,また校正時に変化しない構文構造なども浮き彫りとなった.
|