• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Research-status Report

Creation and utilization of classification criteria for thesaurus maintenance and extension

Research Project

Project/Area Number 19K00655
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 客員教授 (30182489)

Co-Investigator(Kenkyū-buntansha) 加藤 祥  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (40623004)
浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源開発センター, 教授 (80379528)
Project Period (FY) 2019-04-01 – 2025-03-31
Keywordsシソーラス / 分類語彙表 / 分類基準 / 多義語
Outline of Annual Research Achievements

今年度は以下の2点について作業・考察を行った。
(1)分類語彙表増補改訂版(以下、分類語彙表)へ増補する候補語の特徴の記述 昨年度までに「分類語彙表」と「現代日本語書き言葉均衡コーパス短単位語彙表」とをマッチングした結果、一致しなかった(=分類語彙表に掲載されていない)上位3000語について分類番号付与を行った。今年度はその3000語についてどのような特徴があるかを分析した。以下に結果を示す。
(a)分類番号が付けられた語が2979語、付けられなかった語が121語あった。分類番号が付けられなかった121語の多くは誤解析であり、後の一部が取り出されたものであった。
(b)分類番号が付いたもののうち、目立ったのは漢字一字の接辞である。これについては、国立国語研究所(1994)所収の「分類学習漢字表」を一括して増補の対象とすることが考えられる。
(c)分類番号が付いたもの中では、外来語が907語、とくに「ブログ」「ブラウザ」「インストール「フォルダ」などのウェブやコンピュータ関連の語が目立つ。
(2)多義語の掲載状況の確認 「分類語彙表」では初版と比べて、多義語を大幅に増補したと記述されている(P.6)。しかし、現代の小型国語辞書に掲載されている多義語と比べると、「分類語彙表」の多義語は掲出されている分類項目が少ないものがあることが分かった。具体的には「切る」は『三省堂国語辞典』(第八版)では動詞の意味が27個、造語成分としての意味が3個あるが、これら30個の意味を「分類語彙表」と対照させると、単独の見出しがあるものが3個、「スイッチを切る」のように連語として見出しがあるものが6個で、計9個しか対応していなかった。残りの21個は、単独の見出しで掲出できそうなもの15個、連語として掲出できそうなもの6個であった。今後、多義語を見直す際は、できるだけ細かい多義の区別行っている辞書の参照が必要であることが示唆された。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

代表者が一時的に健康を害したことにより、作業の進捗が遅れたため。

Strategy for Future Research Activity

昨年と同様である、分類項目名だけで十分にその内容を表していると思われるものについてはは、記述の優先順位を下げるように、他の分類項目と紛れやすいものを優先する。

例えば,分類項目1.1330「性質」と1.3420「人柄」の間には、「品性」「人間性」「性情」など18語が共通しているが、1.1330「性質」は「1.1抽象的関係」に属しているため、この「性質」は物の性質に限定することが望ましく、人の性質に関しては「1.3人間活動-精神及び行為」に属する1.3420「人柄」の方にのみ掲出すべきである、というような具体的な記述を進める。

Causes of Carryover

代表者が学会業務等で多忙、かつ健康を害したため、分類基準の具体的な記述にあてる時間がとれなかったため。また、意味分類基準を記述する適切な外注業者が見つからなかったことも作業の遅れに影響した。2024年度は分類項目名からその内容が判断できにくい項目、および、他の項目との紛れやすい項目を優先して記述を進める。

  • Research Products

    (3 results)

All 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results)

  • [Journal Article] 『日本語歴史コーパス』に対する分類語彙表番号アノテーションとその利用2023

    • Author(s)
      浅原 正幸, 池上 尚, 鈴木 泰, 市村 太郎, 近藤 明日子, 加藤 祥, 山崎 誠
    • Journal Title

      日本語の研究

      Volume: 19 Pages: 88-96

    • Peer Reviewed
  • [Presentation] 『分類語彙表』における多義語について2023

    • Author(s)
      山崎誠
    • Organizer
      言語資源ワークショップ2023
  • [Presentation] 『分類語彙表』の増補とその問題点2023

    • Author(s)
      山崎誠
    • Organizer
      計量国語学会第67回大会

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi