研究概要 |
本研究の目的は、自然言語処理用辞書に記述する必要がある情報を吟味し、辞書記述のための標準フォーマットを作成すること、また、このフォーマットに従った辞書データベースを作成することである。この目的を達成するために、今年度は以下のような研究を行なった。 1.人間用の辞書からの情報抽出:人間用に出版された英語辞書(ロングマン英々辞書)の名詞に関する記述から、各名詞の統語コード,発音記号,語義情報,用例などの情報を抽出し、これを関係データベースの形式に整理するプログラムを開発し、種々の検索条件によって辞書引きできる柔軟な辞書データベースを作成した。これと前年度開発した動詞用の同様のプログラムを合わせることによって、最も頻度の多い名詞と動詞のための基本プログラムが完成したことになる。 2.名詞の意味定義のための記述形式の設定:1によって抽出された名詞の語義定義の部分を分析し、名詞の意味定義に現れる単語間の基本的な関係を洗出し、名詞の意味定義のための構造の基本形を設定した。 3.意味定義関係の自動抽出プログラムの作成:2の名詞の意味定義のための基本関係の中で、名詞間の上位-下位関係、全体一部分関係,集合一要素関係などの関係をロングマン辞書の意味定義の中から自動的に抽出するプログラム作成し、実際にこれを適用することによって、90%以上の精度で名詞間の意味関係が抽出できることを確認した。 4.記述フォーマットの検討:3の結果を使って、従来の名詞辞書フォーマットの不備や追加すべき情報を確定した。 以上のように、本年度の研究によって、出版された辞書から計算機処理用の辞書を作成する基本資料を得るための手法が確立し、大量実験の準備が完了した。
|