研究分担者 |
田中 康仁 姫路短期大学, 助教授 (00163585)
岡田 直之 大分大学, 工学部, 教授 (80037837)
鶴丸 弘昭 長崎大学, 工学部, 助教授 (90039678)
長尾 真 京都大学, 工学部, 教授 (30025960)
日高 達 九州大学, 工学部, 助教授 (30037931)
|
研究概要 |
機械辞書は自然言語処理において不可欠なものであるにもかかわらず, 現在研究者が自由に使用することのできる辞書は極めて少なく, またその内容も, 高度な自然言語処理研究を進めるためには全く不十分なものでしかない. 機械辞書は個人で作成することが困難であるだけに, 研究者の共通の研究道具としての統合化された機械辞書の開発が望まれる. 本研究は広い立場から機械辞書のあり方について総合的に検討し, 研究者が各々の立場から目的に合わせて再編集して使うことのできる統合化された辞書を作成するための基礎を与えることを目的とする. 本研究の主な成果は次の通りである. 1.数種類の一般辞書において, 見出し語の意味説明文(語義記述文)の形態的特徴を調べ, 語義記述の上で重要な慣用表現を抽出した. また, 語義記述上の問題点を明らかにした. 2.単語の意味辞書作成のため, 一般辞書における語義記述文から, 単語間の上位/下位関係を抽出する手法を開発した. 3.自然言語の意味処理における辞書の役割と構造を明らかにし, これまで困難とされていたいくつかの問題が, 新しい意味辞書を用いて解決されることを示した. 4.未登録語に対処するため, 単語が造語される機構をモデル化した造語モデルを作成し, 有効性を示した. 5.辞書のための情報を大規模テキストファイルから抽出するためのテキストデータベース管理システムを開発した.
|