• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

構文解析モデルの階層的確率オートマトンへの等価変換

研究課題

研究課題/領域番号 24800004
研究機関筑波大学

研究代表者

若林 啓  筑波大学, 図書館情報メディア系, 助教 (40631908)

研究期間 (年度) 2012-08-31 – 2014-03-31
キーワード教師なし構文解析 / 階層的確率オートマトン / 階層型隠れマルコフモデル / 依存構造解析 / チャンキング / フレーズ抽出
研究概要

平成25年度は,依存構造生成モデルと等価な階層的確率オートマトンの導出に取り組んだ.依存構造の主辞および項の属性を状態として,階層数を十分大きくすることで理論的に等価変換が可能であることを明らかにした.一方で,階層数が大きくなることによって,完全な等価性を維持すると計算量の観点から厳密推論が困難になる問題も明らかになった.
しかし,階層数を制限することによって得られる近似モデルは,局所的な依存構造の推定を非常に効率よく高い精度で行うことができることが分かった.この性質を自然言語文章のチャンキング問題に応用し,等価変換により得られた階層的確率オートマトンの階層数を制限した「平坦近似依存構造モデル (Flat Approximated Dependency Grammar; FADG) 」による教師なしチャンキング手法を提案した.これまで,依存構造生成モデルは系列長に対する計算量が大きく,ごく短い文章しか現実的に扱うことができない問題があった.これに対して,FADGは浅い階層の依存構造解析を圧倒的に少ない計算時間で実現する.チャンキングは浅い構文解析を行う問題であり,FADGは教師なし手法として現時点での世界最高精度を達成した.
また,提案モデルの拡張として,トピックモデルの特性を取り入れた系列セグメンテーションモデルを提案し,有用なフレーズ抽出が可能になることを示した.これらの結果は,本研究成果の応用性・拡張性の高さを示しており,系列解析手法における新たなフレームワーク研究基盤を拓いたといえる.

現在までの達成度 (区分)
理由

25年度が最終年度であるため、記入しない。

今後の研究の推進方策

25年度が最終年度であるため、記入しない。

  • 研究成果

    (3件)

すべて 2014 2013

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件)

  • [雑誌論文] 部分統語構造を考慮した階層的確率オートマトンに基づく教師なしチャンキング2014

    • 著者名/発表者名
      若林 啓
    • 雑誌名

      情報処理学会論文誌:データベース(TOD)

      巻: Vol. 7, No. 62 ページ: 印刷中

    • 査読あり
  • [雑誌論文] 部分統語構造を考慮した確率オートマトンに基づく教師なしチャンキング2013

    • 著者名/発表者名
      若林 啓
    • 雑誌名

      電子情報通信学会他共催 第6回 Webとデータベースに関するフォーラム論文集

      巻: - ページ: II-3-2

    • 査読あり
  • [学会発表] 階層型HMMに基づくフレーズ生成トピックモデルの提案2014

    • 著者名/発表者名
      若林 啓
    • 学会等名
      電子情報通信学会他共催 第6回データ工学と情報マネジメントに関するフォーラム (DEIM)
    • 発表場所
      淡路島夢舞台&ウェスティン淡路(兵庫県淡路市)
    • 年月日
      20140303-20140305

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi