• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

大規模階層辞書を用いた日本語機能表現解析体系の研究

公募研究

研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 21011001
研究機関筑波大学

研究代表者

宇津呂 武仁  筑波大学, 大学院・システム情報工学研究科, 准教授 (90263433)

キーワード国語学 / 自然言語処理 / 日本語機能表現 / 複合辞 / 異表記 / 派生 / 機能語 / 階層的辞書
研究概要

本研究では,階層的機能表現辞書に収録されている17,000表現機能表現の全体は,活用形を含む助動詞型15,500表現(基本形で,代表表現500および派生表現3,000)と,助動詞型以外1,360表現(代表表現760および派生表現600)に分かれる.本研究の提案方式では,代表表現と派生表現の間で,機能的用法と内容的用法の分布特性が継承するという仮説を立てた.そして,派生表現の用法判別タスクにおいて,代表表現の機能的用法・内容的用法の分布特性を参照する方式の有効性を検証した.
平成22年度は,「機能表現一覧」の階層性を利用し,階層において下位に位置する派生的表現について,用法が類似するより上位の代表的表現の用例を参照して,用法判定を行う手法を開発した.特に,前後の形態素の品詞が代表・派生間において不変の場合には,代表的表現と派生的表現の間で用法の傾向に相関がある,という特徴を利用する方式を実現した.提案方式に基づいて,派生的表現の用法の分析を行った結果,代表的表現の表記の用法判定済み用例集合(約38,000例)を参照して,派生的表現の表記の用法判定を行うことにより,80%以上の用例の用法を正しく判定できることを示した.
また,階層的機能表現辞書の意味的等価クラスを用いることにより,日英対訳特許文書を対象として,特許文書に特化した日本語機能表現英訳規則の集約的作成および評価を行った.199個の意味的等価クラス全体の中で,91意味的等価クラスに属する日本語機能表現について,翻訳規則を作成し,その中の意味的等価クラス12個に属する日本語機能表現について評価を行なった結果,96.6%の正解率を達成することができた.

  • 研究成果

    (3件)

すべて 2011 2010

すべて 学会発表 (3件)

  • [学会発表] 代表・派生関係および用例を利用した日本語機能表現の解析2011

    • 著者名/発表者名
      鈴木敬文, 宇津呂武仁, 松吉俊, 土屋雅稔
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県,豊橋技術科学大学
    • 年月日
      2011-03-08
  • [学会発表] 特許文における日本語機能表現の集約的英訳規則の作成と評価2011

    • 著者名/発表者名
      島内蘭, 阿部佑亮, 鈴木敬文, 宇津呂武仁, 松吉俊
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県,豊橋技術科学大学
    • 年月日
      2011-03-08
  • [学会発表] Utilizing Semantic Equivalence Classes of Japanese Functional Expressions in Translation Rule Acquisition from Parallel Patent Sentences2010

    • 著者名/発表者名
      Teiji Nagasaka, Ran Shimanouchi, Akiko Sakamoto, Takafumi Suzuki, Yohei Morishita, Takehito Utsuro, Suguru Matsuyoshi
    • 学会等名
      7th International Conference on Language Resources and Evaluation
    • 発表場所
      バレッタ,マルタ
    • 年月日
      2010-05-20

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi