• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

自己増殖型言語知識ベース構築技術に関する研究

研究課題

研究課題/領域番号 09308009
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関東京工業大学

研究代表者

田中 穂積  東京工業大学, 大学院・情報理工学研究科, 教授 (80163567)

研究分担者 白井 清昭  東京工業大学, 大学院・情報理工学研究科, 助手 (30302970)
乾 健太郎  九州工業大学, 情報工学部, 助教授 (60272689)
徳永 健伸  東京工業大学, 大学院・情報理工学研究科, 助教授 (20197875)
研究期間 (年度) 1997 – 1999
研究課題ステータス 完了 (1999年度)
配分額 *注記
22,700千円 (直接経費: 22,700千円)
1999年度: 2,600千円 (直接経費: 2,600千円)
1998年度: 7,200千円 (直接経費: 7,200千円)
1997年度: 12,900千円 (直接経費: 12,900千円)
キーワード言語資源 / コーパス / 形態素解析 / 構文解析 / 確立言語モデル / 知識の自動獲得 / 言語知識ベース / 自然言語処理 / 注釈付きコーパス / 言語知識獲得 / MSLR構文解析法 / 確率一般化LRモデル / 確率GLR構文解析法 / 形態素接続表
研究概要

本研究課題では,自然言語処理に有用な言語知識ベースのうち,特に形態素情報・構文情報が付与されたコーパスに着目し,これを自己増殖的に構築する手法に関する研究を行った.その手法の概要は以下の通りである.まず,大量のテキストの形態素・構文解析を行い,コーパスに付与すべき形態素情報・構文情報を得る.次に,得られた形態素情報・構文情報から,形態素・構文解析に必要な知識や解析精度を向上させるための知識として,接続表と確立一般化LRモデルを学習する.接続表とは,品詞対の隣接可能性に関する知識であり,コーパス内に一度でも隣接して現われた品詞対は隣接可能,それ以外の品詞対は隣接不可能として,品詞タグ付きコーパスから自動的に獲得することができる.一方,確率一般化LRモデルは,解析結果の統計的な意味での正しさの尺度を構文木に与える確率モデルであり,そのパラメタはコーパスに付与された構文情報(構文木)から容易に学習することができる.さらに,得られた知識をもとに再びテキストの形態素・構文解析を行い,コーパスに付与するべき新たな形態素情報・構文情報を得る.このことを繰り返し行うことにより,形態素情報・構文情報が付与されたコーパスを自動的に作成する.実験の結果,本研究課題で提案する手法は,既存の形態素情報・構文情報が付与されたコーパスが存在するとき,その規模を拡大する際に,すなわち形態素・構文情報が付与された文の数を増やす際に有効に働くことが確かめられた.

報告書

(4件)
  • 1999 実績報告書   研究成果報告書概要
  • 1998 実績報告書
  • 1997 実績報告書
  • 研究成果

    (10件)

すべて その他

すべて 文献書誌 (10件)

  • [文献書誌] Kentro Inui: "Probabilistic GLR Parsing : A New Formalization and Its Impact on Parsing Performance"自然言語処理. 5. 33-52 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] 白井清昭: "統計的構文解析における構文的統計情報と語彙的統計情報の統合について"自然言語処理. 5. 85-106 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] Virach Sornlert Iamvanich: "Empirical Support for New Probabilistic Generalized LR Parsing"自然言語処理. 6. 3-22 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] 今井宏樹: "音声認識を目指した確立GLR法を用いた言語モデルの構築"情報処理学会論文誌. 40. 1404-1412 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] 白井清昭: "自然言語解析のためのMSLRパーザ・ツールキット"自然言語処理. (採録予定).

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] Kentaro Inui: "Probabilistic GLR Parsing : A New Formalization and Its Impact on Parsing Performance"Journal of Natural Language Processing. 5. 33-52 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] Kiyoaki Shirai: "A Framework of Integrating Syntactic and Lexical Statistics in Statistical Parsing"Journal of Natural Language Processing. 5. 85-106 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] Virach Sornlertlamvanich: "Empirical Support for New Probabilistic Generalized LR Parsing"Journal of Natural Language Processing. 6. 3-22 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] Hiroki Imai: "Construction of Language Model Using Probabilistic GLR Methods toward Speech Recognition"Transactions of Information Processing Society of Japan. 40. 1404-1412 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要
  • [文献書誌] Kiyoaki Shirai: "MSLR Parser Tool Kit- - Tools for Natural Language Analysis"Journal of Natural Language Processing. (in appear).

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1999 研究成果報告書概要

URL: 

公開日: 1997-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi