1986 年度実績報告書

自然言語処理のための標準辞書フォーマットの作成と辞書データベースの構築

研究課題

研究課題/領域番号	60880008
研究機関	京都大学
研究代表者	辻井潤一京大, 工学部, 助教授 (20026313)
研究分担者	村田賢一情報処理振興事業協会技術センター, 研究員山梨正明京都大学, 教養部, 助教授 (80107086) 中村順一京都大学, 工学部, 助手 (30164304) 長尾真京都大学, 工学部, 教授 (30025960)
キーワード	自然言語処理 / 辞書データベース / 意味記述 / 自然言語理解 / 機械翻訳
研究概要	本研究の目的は、自然言語処理用辞書に記述する必要がある情報を吟味し、辞書記述のための標準フォーマットを作成すること、また、このフォーマットに従った辞書データベースを作成することである。この目的を達成するために、今年度は以下のような研究を行なった。 1.人間用の辞書からの情報抽出:人間用に出版された英語辞書(ロングマン英々辞書)の名詞に関する記述から、各名詞の統語コード,発音記号,語義情報,用例などの情報を抽出し、これを関係データベースの形式に整理するプログラムを開発し、種々の検索条件によって辞書引きできる柔軟な辞書データベースを作成した。これと前年度開発した動詞用の同様のプログラムを合わせることによって、最も頻度の多い名詞と動詞のための基本プログラムが完成したことになる。 2.名詞の意味定義のための記述形式の設定:1によって抽出された名詞の語義定義の部分を分析し、名詞の意味定義に現れる単語間の基本的な関係を洗出し、名詞の意味定義のための構造の基本形を設定した。 3.意味定義関係の自動抽出プログラムの作成:2の名詞の意味定義のための基本関係の中で、名詞間の上位-下位関係、全体一部分関係,集合一要素関係などの関係をロングマン辞書の意味定義の中から自動的に抽出するプログラム作成し、実際にこれを適用することによって、90%以上の精度で名詞間の意味関係が抽出できることを確認した。 4.記述フォーマットの検討:3の結果を使って、従来の名詞辞書フォーマットの不備や追加すべき情報を確定した。以上のように、本年度の研究によって、出版された辞書から計算機処理用の辞書を作成する基本資料を得るための手法が確立し、大量実験の準備が完了した。

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] 中村順一,辻井潤一,長尾真: 情報処理学会論文誌. 27. 801-810 (1986)
[文献書誌] 中村順一,酒井桂一,長尾真: 電子情報通信学会「言語処理とコミュニケーション」研究会資料. 86. 17-24 (1987)
[文献書誌] 中村順一,長尾真: 情報処理学会第34回全国大会. 1291-1292 (1987)