• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

言語データの収集と処理の研究

研究課題

研究課題/領域番号 61120014
研究種目

特定研究

配分区分補助金
研究機関国立国語研究所

研究代表者

野村 雅昭  国語研, その他, その他 (60000428)

研究分担者 荻野 綱男  埼玉大学, 教養学部, 助教授 (00111443)
田中 康仁  姫路短期大学, 経営情報学科, 助教授 (00163585)
中野 洋  国立国語研究所, 言語計量研究部, 室長 (40000426)
山崎 誠  国立国語研究所, 言語計量研究部, 研究員 (30182489)
研究期間 (年度) 1986
研究課題ステータス 完了 (1986年度)
配分額 *注記
16,000千円 (直接経費: 16,000千円)
1986年度: 16,000千円 (直接経費: 16,000千円)
キーワード複合語 / 慣用表現 / 類義語 / 意味記述の形式化 / シソーラス / 語彙の対照 / 機械辞書 / 「分類語彙表」
研究概要

言語情報処理の精度を高めるための基礎的な研究としては、大量の言語データを対象として、それを適切な単位に分割し、必要な情報を与え、より高次のレベルの処理を可能とする技術の開発が必要である。そのために、本年度は、以下の四方面から研究を進めた。
1.複合語データの収集と整理 語構成について、その基本概念を検討し、これにしたがって、以下の複合語データを整理・加工した。すなわち、文部省編「学術用語集」23分野の見出しの抽出と連接表(語基がどのように語を構成するか一覧できる形に整理したもの)、中学校・高校の理科・社会科の語彙の連接表、複合語データベースの作成を行い、それぞれに分析を加えた。また、文献の抄録文から抽出した3,4文字漢字列それぞれ約100万件を分析し、知識データの収集と上位概念の語の抽出実験を行った。さらに各種の慣用表現を収集・分析し、機械可読ファイルを作成した。
2.類義語のデータの収集 類義語の意味を形式化された意味記述法によって分析するために、意義素説を検討し、意味記述の形式化を試みた。さらに、「新明解国語辞典」から本研究のための基礎資料を作成した。
3.名詞のシソーラスの作成 『三省堂国語辞典』の名詞見出しの各語義記述をカード化した。このうち約40%のカードについて、「視点」によって意味関係を整理した。また、カード全体の3分の1について、パーソナル・コンピュータに入力した。
4.日英語彙の機械辞書の作成 『角川類語新辞典』にあって『分類語彙表』にない語彙について分類語彙表の番号を付与した。この結果、増補版「分類語彙表」の収録語数は、46874語となった。その他、日英および日仏語彙の対照を行い、分析の結果を研究会で報告した。

報告書

(1件)
  • 1986 実績報告書
  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 野村雅昭: 日本語学. 6-4. (1987)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 田中康仁: 情報処理学自然会言語処理研究会報告. 60. 17-26 (1987)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 中野洋: CL研究. 1. 65-73 (1987)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 山崎誠: 日本語学. 5-11. 76-80 (1986)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 野村雅昭: "複合動詞資料集(特定研究「言語データの収集と処理の研究」報告書)" 270 (1987)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 荻野綱男: "反対語意識のしくみ(日本言語学会第93回大会発表資料)" 54 (1986)

    • 関連する報告書
      1986 実績報告書

URL: 

公開日: 1987-03-31   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi