自然言語処理のための汎用の辞書システムを作成するための第一歩として、本年度は、次のような研究を行なった。 (1)ロングマン辞書の計算機データベース化:ロングマン英英辞書は、人間用の辞書として作成されたものであるが、統語コードなど計算機処理にとっても有効な情報を各種備えている。この辞書を関係データベースの形式に記憶することによって、辞書に含まれる情報を様々な角度から検索できる汎用のデータベースシステムを開発した。これは、自然言語処理用の汎用データベースとして使用できる他に、来年度英語辞書を作成するための基礎データとすることができる。 (2)辞書データの検査と形式変換のための汎用システムの作成:自然言語処理用の辞書は各種の情報をコード化した非常に複雑な構造を持つ。この種のデータ作成を容易に行なうためのデータ形式の変換プログラム、および、記述内容の検査を行なう汎用のソフトウェア・システムを開発した。 (3)辞書記述フォーマットの決定:現在我々が開発している機械翻訳システム用の日本語辞書、英語辞書の記述フォーマットをもとに、自然言語処理用の汎用の辞書フォーマットを作成した。また、大量の単語に対しての作業を効率良く行なうために、この記述フォーマットに記入するための作業基準を明確にした。特に、これまでの辞書作業の中で困難であった格の認定基準や名詞意味マーカの記述基準を明確にした。 以上のように、本年度は、研究の第一年度として、次年度以降の研究を行なうための基礎的な準備を行ない、十分な成果を得ることができた。
|