研究課題/領域番号 |
61120014
|
研究機関 | 国立国語研究所 |
研究代表者 |
野村 雅昭 国語研, その他, その他 (60000428)
|
研究分担者 |
荻野 綱男 埼玉大学, 教養学部, 助教授 (00111443)
田中 康仁 姫路短期大学, 経営情報学科, 助教授 (00163585)
中野 洋 国立国語研究所, 言語計量研究部, 室長 (40000426)
山崎 誠 国立国語研究所, 言語計量研究部, 研究員 (30182489)
|
キーワード | 複合語 / 慣用表現 / 類義語 / 意味記述の形式化 / シソーラス / 語彙の対照 / 機械辞書 / 「分類語彙表」 |
研究概要 |
言語情報処理の精度を高めるための基礎的な研究としては、大量の言語データを対象として、それを適切な単位に分割し、必要な情報を与え、より高次のレベルの処理を可能とする技術の開発が必要である。そのために、本年度は、以下の四方面から研究を進めた。 1.複合語データの収集と整理 語構成について、その基本概念を検討し、これにしたがって、以下の複合語データを整理・加工した。すなわち、文部省編「学術用語集」23分野の見出しの抽出と連接表(語基がどのように語を構成するか一覧できる形に整理したもの)、中学校・高校の理科・社会科の語彙の連接表、複合語データベースの作成を行い、それぞれに分析を加えた。また、文献の抄録文から抽出した3,4文字漢字列それぞれ約100万件を分析し、知識データの収集と上位概念の語の抽出実験を行った。さらに各種の慣用表現を収集・分析し、機械可読ファイルを作成した。 2.類義語のデータの収集 類義語の意味を形式化された意味記述法によって分析するために、意義素説を検討し、意味記述の形式化を試みた。さらに、「新明解国語辞典」から本研究のための基礎資料を作成した。 3.名詞のシソーラスの作成 『三省堂国語辞典』の名詞見出しの各語義記述をカード化した。このうち約40%のカードについて、「視点」によって意味関係を整理した。また、カード全体の3分の1について、パーソナル・コンピュータに入力した。 4.日英語彙の機械辞書の作成 『角川類語新辞典』にあって『分類語彙表』にない語彙について分類語彙表の番号を付与した。この結果、増補版「分類語彙表」の収録語数は、46874語となった。その他、日英および日仏語彙の対照を行い、分析の結果を研究会で報告した。
|