研究課題/領域番号 |
08408009
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
辻井 潤一 東京大学, 大学院・理学系研究科, 教授 (20026313)
|
研究分担者 |
鳥澤 健太郎 東京大学, 大学院・理学系研究科, 助手 (70282712)
|
研究期間 (年度) |
1996 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
22,100千円 (直接経費: 22,100千円)
1998年度: 2,000千円 (直接経費: 2,000千円)
1997年度: 9,800千円 (直接経費: 9,800千円)
1996年度: 10,300千円 (直接経費: 10,300千円)
|
キーワード | 自然言語処理 / 構文解析アルゴリズム / HPSG文法 / 知識獲得 / 格フレーム生成 / 意味分類 / 文法フォーマリズム / 単一化文法 / 論理型プログラミング言語 / 構文解析 / 機械学習 / 統計処理 / 文法学習 / 構文解析システム / 文法 / 素性構造記述言語 |
研究概要 |
本研究では自然言語で書かれた文の構文解析と知識獲得が同一視できる主辞駆動句構造文法(Head-driven Phrase Structure Grammar,HPSG)のための構文解析器(パーザー)及び文法の開発を行った。まず、構文解析器であるが、前年度から開発を続けているパーザー、文法開発用プログラミング言語LiLFeSを設計し、その処理系としてバイトコード・コンパイラ及びエミュレーターとネイティブコードコンパイラという2種の異なるものを開発した。また、LiLFeS上にパーザーを開発したが、このパーザーはオリジナルのHPSGで記述された文法を文脈自由文法に変換し、パーズ時にその文脈自由文法を使用することで、解析効率が数倍から10倍程度にまで向上されている。また、パーザー上で使用できる文法としては英語、日本語の二つの言語のために開発した。前述のパーザーを使うと日本語文法は新聞に現れる文の98%を平均250msec程度で解析することができる。また、単語に関する詳細な情報を与えていないにも関わらず、係受けの解析精度は80%を達成することができた。英語文法は、HPSGとは全く異なる既存のTree Adjoining GrammarをHPSGのフレームワークに移植することで作成した。また、研究の最終的なゴールである知識獲得に関しては、新聞10年分のテキストをわれわれのシステムを使って解析し、統計的処理を行って動詞に対する格フレームを生成する手法、及び解析結果を基に単語の意味分類を行なう手法を開発した。
|