研究概要 |
本研究では,階層的機能表現辞書に収録されている17,000表現機能表現の全体は,活用形を含む助動詞型15,500表現(基本形で,代表表現500および派生表現3,000)と,助動詞型以外1,360表現(代表表現760および派生表現600)に分かれる.本研究の提案方式では,代表表現と派生表現の間で,機能的用法と内容的用法の分布特性が継承するという仮説を立てた.そして,派生表現の用法判別タスクにおいて,代表表現の機能的用法・内容的用法の分布特性を参照する方式の有効性を検証した. 平成21年度は,上記の仮説に基づき,対象テキストを新聞記事テキストに限定したうえで,助動詞型代表表現のうち,新聞記事1年分に50回以上出現(基本形換算)し,かつ,その用例が90%以上機能的用法である表現を抽出した.そして,それらの代表表現の派生表現158表現(基本形換算)の用例945例を収集し,上記の仮説「代表表現と派生表現の間で,機能的用法と内容的用法の分布特性が継承する」を検証した.その結果,仮説が成立するための重要な条件として,「代表表現と派生表現の間で,前後の形態素の品詞が同一である」必要があることを発見した. また,階層的機能表現辞書の意味的等価クラスを用いることにより,日本語機能表現の英訳規則および中国語訳規則が集約的に作成可能であることを実証した.特に,英訳規則作成においては,日英対訳特許文書を対象として,特許文書に特化した日本語機能表現英訳規則の集約的作成を行った.
|