研究分担者 |
坂本 義行 電子技術総合研究所, ソフトウェア部, 主任研究官
荻野 綱男 筑波大学, 文芸言語学系, 助教授 (00111443)
田中 康仁 姫路短期大学, 経営情報学科, 助教授 (00163585)
山崎 誠 国立国語研究所, 言語計量研究部, 研究員 (30182489)
中野 洋 国立国語研究所, 言語計量研究部, 室長 (40000426)
|
研究概要 |
言語情報処理の精度を高めるための基礎的研究として, 五方面から問題の解決を図った. 本年度はデータの収集と加工に重点を置き, 整理の済んだデータについては分析と考察にも着手し, 進展を見た. 1.複合語データ処理:学術用語データについては, 語基連接表を刊行するとともに, 造語力・同音語等についての分析を行った. 新聞データについては, 複合語ファイルおよび語と語の関係ファイルを作成し, その一部を刊行した. 既に収集した三文字漢字列・四文字漢字列データについては, その結合関係の分析を進めている. それらの中から基本的な語基を抽出した造語辞書, 大量データとシソーラスを結合した機械辞書の作成が次の課題である. 2.日英語彙の機械辞書の作成:前年度に収集した『分類語彙表』増補のためのデータの整理を行い, 現行版(約3万3千語)に対して, 約1万6千語の追加候補語を確定した. また, 『コンサイス英和辞典』データの整理を行い, 意味分類のための情報を付加した. 次年度は, これらを総合して, 意味分類体の日英対照機械辞書を作成する予定である. 3.類義語の意味処理:類義語の意味を形式化された意味記述法によって記述する手順を確立した. また, それに基づいて, 機械および人手で意義特徴を付与する方法を開発し, ファイルの作成を継続した. 4.名詞のシソーラスの作成:『三省堂国語辞典』から抽出したデータについて, ほぼすべての第一次判定作業を終えた. また, 全体の約2分の1にあたる量について, パソコンへの入力を済ませた. 次年度は, 入力を完了し, 判定の見直しを施して, FDによる公表を行う予定である. 5.自動意味情報付与:用言が支配する格と名詞による格フレームを定め, 名詞の意味マーカーの共起意味相関マトリックスを作成するための実験解析を中心とする作業を進めた.
|