• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

従属句の分類と接続助詞の結合順位に基づく複文と重文の構文解析に関する研究

研究課題

研究課題/領域番号 14780294
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関九州大学

研究代表者

市丸 夏樹  九州大学, 大学院・システム情報科学研究院, 助手 (80274497)

研究期間 (年度) 2002 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
1,200千円 (直接経費: 1,200千円)
2003年度: 300千円 (直接経費: 300千円)
2002年度: 900千円 (直接経費: 900千円)
キーワード構文解析 / 日本語 / 接続助詞 / 従属句 / 結合順位 / 述語句 / PCFG / テキストコーパス / 日本語の構文解析 / 構文的な曖昧性の解消 / 接続助詞の分類 / 従属句・述語句
研究概要

構文解析の解候補である複数の構文木の中から自然な解釈だと思われるような解を選び出すために,南氏の従属句の分類を細分化し,接続助詞を左右の句を繋ぐ結合演算子とみなした文法を構築した.昨年度までに接続助詞の結合順位を最適化していたため,今年度はその結合順位を組み込んだPCFGを作成し,1文の構文解析実験を行った.
1.テキストコーパス中の構文木を用いて接続助詞の結合順位を最適化するアルゴリズムを開発.
今年度はさらに高速化を図り,付属語一般約300語の結合順位を約3分で最適化できるようになった.従来の研究では南氏の3分類の場合,A類<A類+読点<B類<B類+読点<…という順序が用いられていたが,我々の調査によりA類<B類<…<A類+読点<B類+読点<…のように読点を後の方に並べ替えた方がよりコーパスに合致することが確認された.
2.接続助詞の結合順位を組み込んだPCFGの構築.
「ながら」「が」など複数の用法から複数の分類に属し得る接続助詞や,接続助詞「と」のように格助詞とまぎらわしい助詞の多義性については,周辺の手がかり語や係り受け関係にある動詞の格パターン等を用いて判別することによって対処した.
3.PCFGによる1文の構文解析.
従来のPCFG文法では1000文中に数文程度の割合で,まれに1文の構文解析時間が何時間もかかる場合があったが,この文法では従属句間の修飾被修飾関係がほぼ一意に決まるため,最悪の場合でも数分程度で終わるようになった.係り受けの正解率は75%と従来手法に及ばず,1文の解析精度はまだ十分ではないが,これは学習用例数が少ないためであると考えられる.
この研究により求められた接続助詞の結合順位は,自然な語順による分生成や文生成時の読点付与や,発話時のポーズ位置の決定などに応用できるものと考えられる.

報告書

(2件)
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 市丸夏樹, 飛松弘征: "接続助詞の結合順位に基づく複文の構文解析"情報処理学会自然言語処理研究会研究報告 NL-158. 2003・108. 81-86 (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi