1994 Fiscal Year Annual Research Report
Project/Area Number |
04452197
|
Research Institution | KYUSHU UNIVERSITY |
Principal Investigator |
雨宮 真人 九州大学, 大学院総合理工学研究科, 教授 (90202697)
|
Co-Investigator(Kenkyū-buntansha) |
中藤 哲也 中央計数施設, 助手 (20253502)
日下部 茂 九州大学, 大学院総合理工学研究科, 助手 (70234416)
鶴田 直之 九州大学, 大学院総合理工学研究科, 助手 (60227478)
峯 恒憲 九州大学, 理学部, 講師 (30243851)
谷口 倫一郎 九州大学, 大学院総合理工学研究科, 助教授 (20136550)
|
Keywords | 類似度計算 / 格フレーム / 並列処理 / 自動分類 / 意味ネットワーク / 並列自然言語処理 / 用例ベース / 知識獲得 |
Research Abstract |
本年度は、研究の最終年度として、並列自然言語処理システムを構築する上での問題点を明らかにするとともに、次期バ-ジョンシステム構築に向けての基本検討を行うことを目的として、次のことを行った。 1.格フレームから生成された有限状態オートマトンを予測情報として利用する並列構文解析法の開発 約1000の格フレーム規則数から、格要素や動詞に関するトップダウンの制約情報を与える有限オートマトンを生成し、それを利用して並列に解析を行う並列構文解析法の提案を行った。 2.格フレーム要素の自動獲得法の開発 1.で述べた有限オートマトンを生成するために利用した格フレーム規則は、意味素性の数が少なく、解析を行うには抽象的過ぎたため、実際の例文から格フレーム規則を自動的に獲得する方法の開発を行った。実際の例文では、格の省略が多いことや、必須格、任意格をどう扱うかという問題があるため、一度に格フレーム全体を獲得する事はやめ、他動詞の場合には、2つの格要素を持つような格フレームの部分要素(格フレーム要素と呼ぶ)を獲得することとした。これでは、既存の電子化辞書を利用して、文の類似度計算を行うことで、同じ動詞の語義をもつ文の集合を構成する。そして、生成された文の集合に、動詞の格要素の格ラベルならびに、動詞の語義ラベルを付加し、格要素を獲得する。実験では、20個の動詞を選び、各動詞について、既存の格フレームの説明のために付属している例文や、国語辞書、新聞記事などから抜きだした文を50文用意して行った。 3.大規模意味ネットワークの並列探索システムの開発 2.の格フレーム要素の自動獲得法で利用した電子化辞書は、大規模な意味ネットワークに相当し、商用の逐次型計算機では、全体の探索を行うことは過負荷であった。そのため、2で作成したシステムを共有メモリ型の並列計算機上に実現し、処理の高速化を行うこととした。共有メモリ型の並列計算機の利用では、先の年度に開発した並列構文解析システムの知見を活かすことができた。システム全体の基本設計ならびに、意味ネットワークの並列探索を行う基本部分まで完成した。
|
Research Products
(2 results)
-
[Publications] 峯他: "既存の単語辞書を利用した動詞概念の自動クラスタリング法" 「自然言語処理における学習」シンポジウム論文集. 112-119 (1995)
-
[Publications] T.Mine: "Parallel Parsing with a Case Frame Automaton" RWC Technical Report TR-94001. 1. 39-40 (1994)