1996 Fiscal Year Annual Research Report
自己増殖能力を持つ文法フォーマリズムとそのための超高速パーザーの開発
Project/Area Number |
08408009
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Research Institution | The University of Tokyo |
Principal Investigator |
辻井 潤一 東京大学, 大学院・理学系研究科, 教授 (20026313)
|
Co-Investigator(Kenkyū-buntansha) |
鳥澤 健太郎 東京大学, 大学院・理学系研究科, 助手 (70282712)
|
Keywords | 自然言語処理 / 構文解析アルゴリズム / 機械学習 / 統計処理 |
Research Abstract |
本年度は、研究初年度として基礎的な研究をおこなった。研究計画に述べた概要にしたがって、それらを分類すると次のようになる。 [1]高速なHPSGパーザーの開発:我々独自のアルゴリズムをベースとし、以前から開発しているプロトタイプのHPSGパーザーをさらに発展改良し、さらに高速なパーザーを開発をおこなった。改良されたパーザーの特徴は以下の2点である。A)従来グラフ間のマージとして実現されてきた素性構造の単一化を抽象機械の実行で置き換えた。この際、我々のアルゴリズムで使用される部分的単一化という手続きも抽象機械の実行に置き換える手法を開発した。B)プロトタイプでは有限状態オートマトンにより構文木を生成したが、その有限状オートマトンをCFGに変換、CKYパーザーにより高速なパ-ズをおこなう。実装は全て終了したわけではないが、以上の改良により、プロトタイプに比較して5倍から10倍の高速化が期待される。また、上述の手法によりHPSGから変換されたCFGを用いることが可能な並列CKYパーザーの開発もおこない、少なくとも10倍程度の台数効果が達成できることを確認した。 [2]HPSGをベースとした種々の文法の整備:3種の文法の開発を同時に行なった。一つはVoiceなどの日本語の言語現象を取り扱う言語学的に妥当な文法、もう一つは、以下に述べる文法獲得モデル、統計的情報の付与を容易にすることを狙った文法。また、さらに、京大で開発されているKNPとよばれるパーザーの文法を移植したものも、KNPの曖昧性解消モジュールとのインターフェースも含め開発をおこなった。 [3]フォーマリズム上での文法獲得モデルの整備:HPSGに良く似た枠組であるCategorial Grammarの極限における同定という文法獲得モデルについて理論的考察および予備的実験をおこなった。 [4]統計的情報の付与に関する理論的研究:University of Penn.でad-hocな文法枠組をベースに開発されたDependency Bigramといわれる手法をHPSGに取り込み、受動態などに見られる表層格の変更などの複雑な現象にも統計量が導入できるよう改良をおこなった。[2]で記述したが、Dependency Bigramで取り扱いやすいHPSGベースの文法についても開発、部分的な実現をおこなった。
|
Research Products
(5 results)
-
[Publications] 二宮 崇: "並列HPSGパーザーに向けて" 情報処理学会研究報告97-NL-117. 97・4. 75-81 (1997)
-
[Publications] 二宮 崇: "並列オブジェクト指向言語ABCLIfによる大規模並列計算機上のスケーラブルなCKYパーザー" WOOC'97.
-
[Publications] K.Torisawa: "off-line Raising,Dependency Analysis and Partial Unification" Third International Conference on HPSG. 14-23 (1996)
-
[Publications] K.Torisawa: "Computing Phrasal-signs in HPSG prior to Parsing" COLING'96. 949-955 (1996)
-
[Publications] 牧野 貴樹: "高速なHPSGパーザーに向けて、素性構造抽象機械と部分単一化の実装" NLP'97. (1997)