• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

シソーラスの整備・拡張のための分類基準の作成と活用

研究課題

研究課題/領域番号 19K00655
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分02070:日本語学関連
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 客員教授 (30182489)

研究分担者 加藤 祥  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (40623004)
浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, 教授 (80379528)
研究期間 (年度) 2019-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワードシソーラス / 分類語彙表 / 分類基準 / 多義語 / オープンデータ / 分類語違表 / 意味分類の基準
研究開始時の研究の概要

本研究は,日本語研究でもっとも活用されているシソーラスである『分類語彙表増補改訂版』(以下,『分類語彙表』)を将来にわたって効率的に整備・拡張できるように,現在,「暗黙知」の状態になっている分類基準を明示的に記述した「分類基準」を作成し,それに基づいて『分類語彙表』に未収録の新語や新用法等を増補した『分類彙表ver.2.0』作成することを目的とする。併せて,各見出し語に対して文体情報や頻度情報等の情報も付与し,日本語研究でのより一層の活用を目指す。「分類基準」および『分類語彙表ver.2.0』は誰でも自由に利用できるオープンデータとして公開する。

研究実績の概要

今年度は以下の2点について作業・考察を行った。
(1)分類語彙表増補改訂版(以下、分類語彙表)へ増補する候補語の特徴の記述 昨年度までに「分類語彙表」と「現代日本語書き言葉均衡コーパス短単位語彙表」とをマッチングした結果、一致しなかった(=分類語彙表に掲載されていない)上位3000語について分類番号付与を行った。今年度はその3000語についてどのような特徴があるかを分析した。以下に結果を示す。
(a)分類番号が付けられた語が2979語、付けられなかった語が121語あった。分類番号が付けられなかった121語の多くは誤解析であり、後の一部が取り出されたものであった。
(b)分類番号が付いたもののうち、目立ったのは漢字一字の接辞である。これについては、国立国語研究所(1994)所収の「分類学習漢字表」を一括して増補の対象とすることが考えられる。
(c)分類番号が付いたもの中では、外来語が907語、とくに「ブログ」「ブラウザ」「インストール「フォルダ」などのウェブやコンピュータ関連の語が目立つ。
(2)多義語の掲載状況の確認 「分類語彙表」では初版と比べて、多義語を大幅に増補したと記述されている(P.6)。しかし、現代の小型国語辞書に掲載されている多義語と比べると、「分類語彙表」の多義語は掲出されている分類項目が少ないものがあることが分かった。具体的には「切る」は『三省堂国語辞典』(第八版)では動詞の意味が27個、造語成分としての意味が3個あるが、これら30個の意味を「分類語彙表」と対照させると、単独の見出しがあるものが3個、「スイッチを切る」のように連語として見出しがあるものが6個で、計9個しか対応していなかった。残りの21個は、単独の見出しで掲出できそうなもの15個、連語として掲出できそうなもの6個であった。今後、多義語を見直す際は、できるだけ細かい多義の区別行っている辞書の参照が必要であることが示唆された。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

代表者が一時的に健康を害したことにより、作業の進捗が遅れたため。

今後の研究の推進方策

昨年と同様である、分類項目名だけで十分にその内容を表していると思われるものについてはは、記述の優先順位を下げるように、他の分類項目と紛れやすいものを優先する。

例えば,分類項目1.1330「性質」と1.3420「人柄」の間には、「品性」「人間性」「性情」など18語が共通しているが、1.1330「性質」は「1.1抽象的関係」に属しているため、この「性質」は物の性質に限定することが望ましく、人の性質に関しては「1.3人間活動-精神及び行為」に属する1.3420「人柄」の方にのみ掲出すべきである、というような具体的な記述を進める。

報告書

(5件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (21件)

すべて 2023 2022 2021 2020 2019

すべて 雑誌論文 (8件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (12件) 図書 (1件)

  • [雑誌論文] 『日本語歴史コーパス』に対する分類語彙表番号アノテーションとその利用2023

    • 著者名/発表者名
      浅原 正幸, 池上 尚, 鈴木 泰, 市村 太郎, 近藤 明日子, 加藤 祥, 山崎 誠
    • 雑誌名

      日本語の研究

      巻: 19 ページ: 88-96

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] 計量的語彙研究の課題―法則と理論からの解放―2023

    • 著者名/発表者名
      山崎誠
    • 雑誌名

      一橋日本語教育研究

      巻: 11 ページ: 1-8

    • 関連する報告書
      2022 実施状況報告書
    • オープンアクセス
  • [雑誌論文] 形容詞の通時的語義・用法データベースの作成2021

    • 著者名/発表者名
      山崎誠, 村田菜穂子, 前川武, 村山実和子
    • 雑誌名

      人文科学とコンピュータシンポジウム

      巻: 2021 ページ: 170-175

    • NAID

      170000186286

    • 関連する報告書
      2021 実施状況報告書
  • [雑誌論文] テキストにおける同音異義語の分布2021

    • 著者名/発表者名
      山崎誠
    • 雑誌名

      言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop

      巻: 6 ページ: 204-209

    • DOI

      10.15084/00003494

    • NAID

      120007181952

    • URL

      http://id.nii.ac.jp/1328/00003494/

    • 関連する報告書
      2021 実施状況報告書
    • オープンアクセス
  • [雑誌論文] 『分類語彙表』の質的拡張の試み2020

    • 著者名/発表者名
      山崎誠
    • 雑誌名

      言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop

      巻: 5 ページ: 365-370

    • DOI

      10.15084/00003176

    • NAID

      120006978775

    • URL

      http://id.nii.ac.jp/1328/00003176/

    • 関連する報告書
      2020 実施状況報告書
    • オープンアクセス
  • [雑誌論文] 辞書における自動詞・他動詞とコーパスにおける実態2020

    • 著者名/発表者名
      山崎誠
    • 雑誌名

      江田すみれ・堀恵子(編)『自動詞と他動詞の教え方を考える』くろしお出版

      巻: - ページ: 57-72

    • 関連する報告書
      2020 実施状況報告書
  • [雑誌論文] 意味分類の客観性を探る―『分類語彙表増補改訂版』と『新明解類語辞典』との比較―2020

    • 著者名/発表者名
      山崎誠
    • 雑誌名

      語彙研究

      巻: 17 ページ: 1-10

    • NAID

      40022242669

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] 分類語彙表番号を付与した『現代日本語書き言葉均衡コーパス』の書籍・新聞・雑誌データ2019

    • 著者名/発表者名
      加藤 祥, 浅原 正幸, 山崎 誠
    • 雑誌名

      日本語の研究

      巻: 15 ページ: 135-141

    • NAID

      130007794019

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [学会発表] 『分類語彙表』における多義語について2023

    • 著者名/発表者名
      山崎誠
    • 学会等名
      言語資源ワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 『分類語彙表』の増補とその問題点2023

    • 著者名/発表者名
      山崎誠
    • 学会等名
      計量国語学会第67回大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 『日本語歴史コーパス』への形容詞の語義・用法情報の追加2023

    • 著者名/発表者名
      山崎誠, 村田菜穂子, 前川武, 村山実和子
    • 学会等名
      言語処理学会第29回年次大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 『分類語彙表』のこれまでとこれから2023

    • 著者名/発表者名
      山崎誠
    • 学会等名
      第17回 NINJALフォーラム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 医療記録における縮約表現の量的構造―医療用語との比較―2022

    • 著者名/発表者名
      山崎誠, 黒田航, 東条佳奈, 西嶋佑太郎, 麻子軒, 相良かおる
    • 学会等名
      言語資源ワークショップ2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 『分類語彙表』の構造と特徴2022

    • 著者名/発表者名
      山崎誠
    • 学会等名
      第44回NINJALチュートリアル
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 『分類語彙表』を利用した研究2022

    • 著者名/発表者名
      山崎誠
    • 学会等名
      第44回NINJALチュートリアル
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 『日本語日常会話コーパス』の語彙表および語数表2022

    • 著者名/発表者名
      大村舞, 柏野和佳子, 山崎誠
    • 学会等名
      シンポジウム「日常会話コーパス」VII
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 「語誌情報ポータル」にみる語の消長2022

    • 著者名/発表者名
      山崎誠
    • 学会等名
      NINJALフォーラム2021
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 『分類語彙表増補改訂版データベース』への語種情報の付与2021

    • 著者名/発表者名
      山崎誠
    • 学会等名
      計量言語学会第65回大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 意味分類の客観性を探る:『分類語彙表増補改訂版』と 『新明解類語辞典』との比較2019

    • 著者名/発表者名
      山崎誠
    • 学会等名
      2019 年語彙研究会大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 実践医療用語の語構成要素への分割と意味ラベル付与の試み2019

    • 著者名/発表者名
      山崎誠
    • 学会等名
      言語資源活用ワークショップ2019
    • 関連する報告書
      2019 実施状況報告書
  • [図書] 語彙の原理―先人たちが切り開いた言葉の沃野―(シリーズ日本語の語彙1)2019

    • 著者名/発表者名
      石井正彦,佐藤武義,宮田公治,山崎誠ほか
    • 総ページ数
      208
    • 出版者
      朝倉書店
    • ISBN
      9784254516616
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi