大規模通時コーパスを用いた現代新聞文章の叙述基本語の発見とその成立過程の解明
Project/Area Number |
22K00594
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02070:Japanese linguistics-related
|
Research Institution | Nihon University |
Principal Investigator |
金 愛蘭 日本大学, 文理学部, 准教授 (90466227)
|
Co-Investigator(Kenkyū-buntansha) |
石井 正彦 大阪大学, 大学院人文学研究科(人文学専攻、芸術学専攻、日本学専攻), 教授 (10159676)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
|
Keywords | 基本語彙 / 叙述基本語 / 文章ジャンル / 毎日新聞 / 通時コーパス / 語彙史 / 言語変化 / 語彙・意味 / 新聞文章 |
Outline of Research at the Start |
本研究は、日本語の基本語彙論および基本語彙史研究の一環として、現代語の書きことばの基本語彙のうち、文章の叙述の側面を担う「叙述基本語」に注目し、大規模な通時コーパスを整備・利用することによって、具体的な文章ジャンルの叙述基本語を発見するとともに、それらの成立過程を解明する。個別の文章ジャンルの叙述基本語を明らかにすることにより、それらが集積・構成する「真の基本語彙」の構造を正しく把握し、それら基本語彙がなぜ現在の構造をもつに至ったのか、個々の語がなぜ基本語彙に加わることになったのか等を説明し得る、より高次の基本語彙(史)研究が可能となる。
|
Outline of Annual Research Achievements |
本研究は、日本語の基本語彙論および基本語彙史研究の一環として、現代語の書きことばの基本語彙のうち、文章の叙述の側面を担う「叙述基本語」に注目する。具体的には、現代の新聞文章を対象とし、その大規模な通時コーパスを整備・利用することによって、新聞の主な紙面=文章ジャンルの叙述基本語を、量的な基準・方法と質的な基準・方法との両面から発見・特定するとともに、それらの成立過程を解明することを目的とする。そのために、計画期間を通して以下のことを行う。 (1)通時コーパスの増補と整備、(2)叙述基本語選定のためのサブコーパスの作成、(3)叙述基本語の取り出し(量的分析)、(4)叙述基本語の質的分析、(5)叙述基本語の成立過程の解明 本年度は、このうちの(1)と(2)について、以下のことを行った。 (1)通時コーパスの増補と整備:すでに作成済みの『毎日新聞経年コーパス(第4版)』(1950年から2010年までの『毎日新聞』からほぼ10年おきに各年36日分の朝刊全紙面の記事文章(見出し・本文)を入力した、総文字数約2140万字のプレーンコーパス)について、新たに2020年分のデータを同じ基準で入力し、全体を増補した。 (2) 叙述基本語選定のためのサブコーパスの作成:『毎日新聞経年コーパス』の2000年以降のデータから、各紙面=文章ジャンルごとに、語彙散布度(lexical dispersion)の解析に耐えられるよう、層別とサイズ調整を施した「サブコーパス」の作成に着手した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本年度に予定した上記(1)(2)のうち、(1)の『毎日新聞経年コーパス』の増補と整備については、2020年分の増補は完了したものの、1950年分のデータ整備(形態素解析の精度を上げるための現代仮名遣い・新字体への変換作業)については、作業の基本方針・マニュアルの策定と作業量の見積もりに手間取り、データの修正作業に着手することができなかった。 (2)については、最適な語彙散布度(lexical dispersion)、および、層別とサイズ調整の方法に関する検討を進めたが、いずれも最終的な決定には至らず、なお検討を継続する必要がある。
|
Strategy for Future Research Activity |
2023年度には、上記(1)(2)について作業を継続し、『毎日新聞経年コーパス(第5版)』および(2000年以降の)「サブコーパス」を完成させるとともに、以下のことを行う。 (3)叙述基本語の取り出し(量的分析):最も適当と考えられる語彙散布度の指標(計算法)を決定した上で、上記の「サブコーパス」に語彙散布度による解析を施し、層別均等度の大きい語を(2000年以降の)「叙述基本語の候補」として取り出す。この作業は分担者が行う。 (4)叙述基本語の質的分析:上記の「叙述基本語の候補」の使用例を分析し、「叙述型」が認められたものを「叙述基本語」とする。この作業は、研究代表者と分担者が協同して行う。 また、2024年度には、以下のことを行う。 (5)叙述基本語の成立過程の解明:各紙面=文章ジャンルの「叙述基本語」について、『毎日新聞経年コーパス』全体を用いて、その成立過程を記述・解明する。この作業は、研究代表者と分担者が協同して行う。
|
Report
(1 results)
Research Products
(4 results)