自己増殖型言語知識ベース構築技術に関する研究

研究課題

研究課題/領域番号	09308009
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	東京工業大学
研究代表者	田中穂積東京工業大学, 大学院・情報理工学研究科, 教授 (80163567)
研究分担者	白井清昭東京工業大学, 大学院・情報理工学研究科, 助手 (30302970) 乾健太郎九州工業大学, 情報工学部, 助教授 (60272689) 徳永健伸東京工業大学, 大学院・情報理工学研究科, 助教授 (20197875)
研究期間 (年度)	1997 – 1999
研究課題ステータス	完了 (1999年度)
配分額 *注記	22,700千円 (直接経費: 22,700千円) 1999年度: 2,600千円 (直接経費: 2,600千円) 1998年度: 7,200千円 (直接経費: 7,200千円) 1997年度: 12,900千円 (直接経費: 12,900千円)
キーワード	言語資源 / コーパス / 形態素解析 / 構文解析 / 確立言語モデル / 知識の自動獲得 / 言語知識ベース / 自然言語処理 / 注釈付きコーパス / 言語知識獲得 / MSLR構文解析法 / 確率一般化LRモデル / 確率GLR構文解析法 / 形態素接続表
研究概要	本研究課題では,自然言語処理に有用な言語知識ベースのうち,特に形態素情報・構文情報が付与されたコーパスに着目し,これを自己増殖的に構築する手法に関する研究を行った.その手法の概要は以下の通りである.まず,大量のテキストの形態素・構文解析を行い,コーパスに付与すべき形態素情報・構文情報を得る.次に,得られた形態素情報・構文情報から,形態素・構文解析に必要な知識や解析精度を向上させるための知識として,接続表と確立一般化LRモデルを学習する.接続表とは,品詞対の隣接可能性に関する知識であり,コーパス内に一度でも隣接して現われた品詞対は隣接可能,それ以外の品詞対は隣接不可能として,品詞タグ付きコーパスから自動的に獲得することができる.一方,確率一般化LRモデルは,解析結果の統計的な意味での正しさの尺度を構文木に与える確率モデルであり,そのパラメタはコーパスに付与された構文情報(構文木)から容易に学習することができる.さらに,得られた知識をもとに再びテキストの形態素・構文解析を行い,コーパスに付与するべき新たな形態素情報・構文情報を得る.このことを繰り返し行うことにより,形態素情報・構文情報が付与されたコーパスを自動的に作成する.実験の結果,本研究課題で提案する手法は,既存の形態素情報・構文情報が付与されたコーパスが存在するとき,その規模を拡大する際に,すなわち形態素・構文情報が付与された文の数を増やす際に有効に働くことが確かめられた.

報告書

(4件)

研究成果
(10件)

すべてその他

すべて文献書誌 (10件)

[文献書誌] Kentro Inui: "Probabilistic GLR Parsing : A New Formalization and Its Impact on Parsing Performance"自然言語処理. 5. 33-52 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 白井清昭: "統計的構文解析における構文的統計情報と語彙的統計情報の統合について"自然言語処理. 5. 85-106 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Virach Sornlert Iamvanich: "Empirical Support for New Probabilistic Generalized LR Parsing"自然言語処理. 6. 3-22 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 今井宏樹: "音声認識を目指した確立GLR法を用いた言語モデルの構築"情報処理学会論文誌. 40. 1404-1412 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 白井清昭: "自然言語解析のためのMSLRパーザ・ツールキット"自然言語処理. (採録予定).
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Kentaro Inui: "Probabilistic GLR Parsing : A New Formalization and Its Impact on Parsing Performance"Journal of Natural Language Processing. 5. 33-52 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Kiyoaki Shirai: "A Framework of Integrating Syntactic and Lexical Statistics in Statistical Parsing"Journal of Natural Language Processing. 5. 85-106 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Virach Sornlertlamvanich: "Empirical Support for New Probabilistic Generalized LR Parsing"Journal of Natural Language Processing. 6. 3-22 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Hiroki Imai: "Construction of Language Model Using Probabilistic GLR Methods toward Speech Recognition"Transactions of Information Processing Society of Japan. 40. 1404-1412 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Kiyoaki Shirai: "MSLR Parser Tool Kit- - Tools for Natural Language Analysis"Journal of Natural Language Processing. (in appear).
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要

自己増殖型言語知識ベース構築技術に関する研究

研究代表者

田中 穂積 東京工業大学, 大学院・情報理工学研究科, 教授 (80163567)

22,700千円 (直接経費: 22,700千円)

報告書

研究成果

[文献書誌] Kentro Inui: "Probabilistic GLR Parsing : A New Formalization and Its Impact on Parsing Performance"自然言語処理. 5. 33-52 (1998)

説明

関連する報告書

[文献書誌] 白井清昭: "統計的構文解析における構文的統計情報と語彙的統計情報の統合について"自然言語処理. 5. 85-106 (1998)

説明

関連する報告書

[文献書誌] Virach Sornlert Iamvanich: "Empirical Support for New Probabilistic Generalized LR Parsing"自然言語処理. 6. 3-22 (1999)

説明

関連する報告書

[文献書誌] 今井宏樹: "音声認識を目指した確立GLR法を用いた言語モデルの構築"情報処理学会論文誌. 40. 1404-1412 (1999)

説明

関連する報告書

[文献書誌] 白井清昭: "自然言語解析のためのMSLRパーザ・ツールキット"自然言語処理. (採録予定).

説明

関連する報告書

[文献書誌] Kentaro Inui: "Probabilistic GLR Parsing : A New Formalization and Its Impact on Parsing Performance"Journal of Natural Language Processing. 5. 33-52 (1998)

説明

関連する報告書

[文献書誌] Kiyoaki Shirai: "A Framework of Integrating Syntactic and Lexical Statistics in Statistical Parsing"Journal of Natural Language Processing. 5. 85-106 (1998)

説明

関連する報告書

[文献書誌] Virach Sornlertlamvanich: "Empirical Support for New Probabilistic Generalized LR Parsing"Journal of Natural Language Processing. 6. 3-22 (1999)

説明

関連する報告書

[文献書誌] Hiroki Imai: "Construction of Language Model Using Probabilistic GLR Methods toward Speech Recognition"Transactions of Information Processing Society of Japan. 40. 1404-1412 (1999)

説明

関連する報告書

[文献書誌] Kiyoaki Shirai: "MSLR Parser Tool Kit- - Tools for Natural Language Analysis"Journal of Natural Language Processing. (in appear).

説明

関連する報告書

田中穂積東京工業大学, 大学院・情報理工学研究科, 教授 (80163567)