研究課題/領域番号 |
07780326
|
研究種目 |
奨励研究(A)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
宇津呂 武仁 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90263433)
|
研究期間 (年度) |
1995
|
研究課題ステータス |
完了 (1995年度)
|
配分額 *注記 |
1,000千円 (直接経費: 1,000千円)
1995年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | 自然言語処理 / コーパス / 語彙知識獲得 / 多義性類別 / 動詞の用法 / 構文解析 / 用例検索 / 対訳テキスト |
研究概要 |
本研究では、自然言語テキストから語彙知識を獲得し、さらに獲得結果を実際の言語処理において効率的に利用し、処理精度を向上させる手法について研究を行なった。本年度の研究項目は次の3点である。 1.実用レベルの規模のコーパスから、実用レベルの規模の数の動詞について語彙知識を獲得する。 2.動詞の語彙知識獲得において、対訳テキストを利用して動詞の多義性を類別する。 3.自然言語テキストから統語知識を抽出する。 まず、第1点については、これまでに確立してきた動詞の語彙知識獲得手法により、日本電子化辞書の大量の構文解析済み日本語テキストから動詞の語彙知識を獲得する実験を行なった。この実験の結果、動詞の語彙知識獲得の際に多義動詞の多義性を類別しながら語彙知識を獲得するというメカニズムが、実用的規模で有効に機能することが確認できた。 また、第2点については、これまでに確立してきた、動詞の語彙知識獲得ならびに多義動詞の多義性類別の半自動的手法の自動化を実現した。この手法の特徴は、単言語文においては類別することが難しい自然言語の意味的曖昧性を、英語への翻訳結果における意味分類を参照することによって類別できる点である。本研究においては、この利点を損なうことなく、手法の自動化を行なうことができた。 さらに、第3点は、獲得結果を利用した効率的文解析を実現するための基礎研究として行なったもので、効率的文解析で用いる統語知識を自然言語テキストデータから抽出することを行なった。特に、構文解析済みテキストから文脈自由文法の形式の文法規則を抽出する手法を開発した。この手法においては、適用範囲が広くしかも解析精度の高い文法を抽出するために、非終端記号の統計的類似度を用いて文法を一般化するというメカニズムを実現した。
|