研究概要 |
本研究では,階層的機能表現辞書に収録されている17,000表現機能表現の全体は,活用形を含む助動詞型15,500表現(基本形で,代表表現500および派生表現3,000)と,助動詞型以外1,360表現(代表表現760および派生表現600)に分かれる.本研究の提案方式では,代表表現と派生表現の間で,機能的用法と内容的用法の分布特性が継承するという仮説を立てた.そして,派生表現の用法判別タスクにおいて,代表表現の機能的用法・内容的用法の分布特性を参照する方式の有効性を検証した. 平成22年度は,「機能表現一覧」の階層性を利用し,階層において下位に位置する派生的表現について,用法が類似するより上位の代表的表現の用例を参照して,用法判定を行う手法を開発した.特に,前後の形態素の品詞が代表・派生間において不変の場合には,代表的表現と派生的表現の間で用法の傾向に相関がある,という特徴を利用する方式を実現した.提案方式に基づいて,派生的表現の用法の分析を行った結果,代表的表現の表記の用法判定済み用例集合(約38,000例)を参照して,派生的表現の表記の用法判定を行うことにより,80%以上の用例の用法を正しく判定できることを示した. また,階層的機能表現辞書の意味的等価クラスを用いることにより,日英対訳特許文書を対象として,特許文書に特化した日本語機能表現英訳規則の集約的作成および評価を行った.199個の意味的等価クラス全体の中で,91意味的等価クラスに属する日本語機能表現について,翻訳規則を作成し,その中の意味的等価クラス12個に属する日本語機能表現について評価を行なった結果,96.6%の正解率を達成することができた.
|