研究概要 |
今年度は次の3つを実施した.(1)派生関係にある語の網羅的な対応表の整備:日本語に関しては,電子化された大規模な派生語辞書が存在せず,言語学研究においても,派生として扱うべき現象の範疇は必ずしも明確には整理されていない.そこで,既存の日本語単語辞書から派生関係にある可能性がある語の対(派生語候補語対)を網羅的に収集して日本語派生語辞書第一版を編纂した.今年度は,同じ文法カテゴリの語対(広がる/広げる)および語の末尾を共有する語対(修得/未修得)に対象を広げ,昨年度の成果の約2.2倍に相当する約15,000語対からなる,より包括的な派生語辞書を作成した.このうち約1,300語対については,あらかじめ定めた分類基準に照らして派生語対としての適否を人手で弁別した. (2)文法カテゴリ交替に関わる語の統語的特性のモデル化:計画当初の対象である名詞,動詞,形容詞から,形容動詞や副詞の範囲に対象を広げ,派生語間で文法カテゴリ交替を実現する際の統語的な振舞の違いを,語の述語項構造の対応付けによってモデル化した.また,それらをコーパスから大規模に学習するシステムを作成した. (3)言い換え生成システムの実装:コーパスとウェブを活用して文法カテゴリ交替を含む言い換えを生成するシステムを作成した.このシステムは,(i)で作成した派生語辞書を言い換えの範囲を規定する語彙的制約として用いる.また,コーパスから学習した語の共起に関する知識を用いて言い換え先の表現の文法的適格性を推定するとともに,言い換え前後の表現の意味的類似度をウェブから得られる統計量を用いて計算する.(ii)の作業とは並行して実装したため十分な精度が達成できなかったが,(ii)の述語項構造の対応付けに関する情報を制約として加えることで,より精緻な言い換え生成を実現できる可能性は高い.
|