研究課題/領域番号 |
12480089
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
|
研究分担者 |
大谷 朗 大阪学院大学, 情報学部, 講師 (50283817)
EDSON Miyamoto (MIYAMOTO Edson) 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (60335479)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
宮田 高志 奈良先端科学技術大学院大学, 情報科学研究科(現産業技術総合研究所), 助手(研究員) (00283929)
|
研究期間 (年度) |
2000 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
9,700千円 (直接経費: 9,700千円)
2002年度: 3,100千円 (直接経費: 3,100千円)
2001年度: 3,200千円 (直接経費: 3,200千円)
2000年度: 3,400千円 (直接経費: 3,400千円)
|
キーワード | 主辞駆動句構造文 / 制約に基づく文法 / 係り受け解析 / 形態素解析 / 統計的言語処理 / 機械学習 / サポートベクターマシン / 統計処理と制約処理の融合 / 統計的係り受け解析 / 制約に基づく言語処理 / 主辞駆動区構造文法 / 生成語彙 / 主辞駆動句構造文法 / 統計的自然言語処理 / 単一化文法 / 統合処理 / 自然言語処理 / 構文解析 |
研究概要 |
電子化された言語データの増加に伴い、統計的言話処理が盛んに研究されているが、多くは表面的な言語処理が対象であり、詳細な意味解析など深い言語処理を行うには適切でない。一方で、主辞駆動句構造文法に代表される制約に基づく文法では、個々の単語に詳細な言語情報を記述し、単語固有の文法現象を説明することができるが、制約に合致する文の間の解釈の優先度の違いを説明できないこと、制約に少しでも違反する文の解析を行うことができないなどの欠点がある。 本研究では、これら両者の欠点を補うため、高精度の単語係り受け解析を統計情報に基づく頑健な方法で実現し、得られた統語構造を利用して、制約に基づく文法による詳細な解析を行うことを目的とした。その際、制約違反を緩和するために、生成語彙理論で導入されたタイプ強制や共構成という演算を実装するためのソフトウェアシステムとインタフェースを構築した。 係り受け解析については、サポートベクターマシンという機械学習を用い、上昇型に決定的に解析を行うアルゴリズムを提案し、日本語および英語の解析システムを構築した。制約に基づく文法として、主辞駆動句構造文法に基づく日本語文法を引き続き開発するとともに、タイプ強制と共構成という高次の生成演算を行うメカニズムを実装した。また、統計解析および文法情報を受け取って、文解析を行い、その過程を表示するためのユーザインタフェースを構築した。
|