Project/Area Number |
06780329
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Kyushu University |
Principal Investigator |
峯 恒憲 九州大学, 理学部, 講師 (30243851)
|
Project Period (FY) |
1994
|
Project Status |
Completed (Fiscal Year 1994)
|
Budget Amount *help |
¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 1994: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | 類似度計算 / 格フレーム / 並列処理 / 自動分類 / 意味ネットワーク / 自然言語処理 / 用例ベース / 知識獲得 |
Research Abstract |
本年度は、次のことを行った。 1.格フレームから生成された有限状態オートマトンを予測情報として利用する並列構文解析法の開発 2.格フレーム要素の自動獲得法の開発 3.大規模意味ネットワークの並列探索システムの開発 まず、動詞の予測を行うために、格フレーム規則から有限状態オートマトンを生成し、そのオートマトンを予測情報として利用できるような、並列構文解析法の提案をした。つぎに、そのオートマトンを生成するために必要な格フレーム規則の自動獲得法を提案し、その格フレーム規則から意味ネットワークを構成する方法についての検討を行った。格フレーム規則の自動獲得法では、即存の電子化辞書を利用して、文の類似度計算を行うことで、同じ動詞の語義をもつ文の集合を構成する。そして、生成された文の集合に、動詞の格要素の格ラベルならびに、動詞の語義ラベルを付加し、格要素を獲得する。類似度計算に使用した辞書は、(株)日本電子化辞書研究所の評価版第2.1版の日本語単語辞書ならびに概念辞書で、その規模は、概念辞書で、40万語以上のエントリ-を持つ。実験では、20個の動詞を選び、各動詞について、即存の格フレームの説明のために付属している例文や、国語辞書、新聞記事などから抜きだした文を20文用意して行った。その結果、かなり細分類化される傾向があることや、当初用いた類似度計算式の問題などがわかった。また、現在の最高速クラスの逐次計算機でも、大規模な意味ネットワークの探索には、相当な時間を要することなどがわかった。
|