大規模通時コーパスを用いた現代新聞文章の叙述基本語の発見とその成立過程の解明
Project/Area Number |
22K00594
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02070:Japanese linguistics-related
|
Research Institution | Nihon University |
Principal Investigator |
金 愛蘭 日本大学, 文理学部, 准教授 (90466227)
|
Co-Investigator(Kenkyū-buntansha) |
石井 正彦 大阪大学, 大学院人文学研究科(人文学専攻、芸術学専攻、日本学専攻), 教授 (10159676)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
|
Keywords | 基本語彙 / 叙述基本語 / 文章ジャンル / 通時コーパス / 語彙散布度 / 語種 / 類義語 / 新聞 / 毎日新聞 / 語彙史 / 言語変化 / 語彙・意味 / 新聞文章 |
Outline of Research at the Start |
本研究は、日本語の基本語彙論および基本語彙史研究の一環として、現代語の書きことばの基本語彙のうち、文章の叙述の側面を担う「叙述基本語」に注目し、大規模な通時コーパスを整備・利用することによって、具体的な文章ジャンルの叙述基本語を発見するとともに、それらの成立過程を解明する。個別の文章ジャンルの叙述基本語を明らかにすることにより、それらが集積・構成する「真の基本語彙」の構造を正しく把握し、それら基本語彙がなぜ現在の構造をもつに至ったのか、個々の語がなぜ基本語彙に加わることになったのか等を説明し得る、より高次の基本語彙(史)研究が可能となる。
|
Outline of Annual Research Achievements |
本研究は、日本語の基本語彙論および基本語彙史研究の一環として、現代語の書きことばの基本語彙のうち、文章の叙述の側面を担う「叙述基本語」に注目する。具体的には、現代の新聞文章を対象とし、その大規模な通時コーパスを整備・利用することによって、新聞の主な紙面=文章ジャンルの叙述基本語を、量的な基準・方法と質的な基準・方法との両面から発見・特定するとともに、それらの成立過程を解明することを目的とする。そのために、計画期間を通して以下のことを行う。 (1)通時コーパスの増補と整備、(2)叙述基本語選定のためのサブコーパスの作成、(3)叙述基本語の取り出し(量的分析)、(4)叙述基本語の質的分析、(5)叙述基本語の成立過程の解明 本年度は、このうちの(1)~(3)について、以下のことを行った。 (1)通時コーパスの整備:前年度に2020年分を増補した『毎日新聞経年コーパス(第5版)』のうち、1950年のデータについて、仮名遣いや漢字の字体等を統一する作業を行った。 (2)叙述基本語選定のためのサブコーパスの作成:単一の文章ジャンル(紙面)として「社説」を選び、『毎日新聞経年コーパス(第5版)』の2000年以降のデータから、層別とサイズ調整を施した「社説サブコーパス」を作成した。 (3)叙述基本語の取り出し(量的分析):上記「社説サブコーパス」の各語に、語彙散布度としてGries(2008)のDP(deviation of proportions)による解析を施し、層別均等度の大きい語を(2000年以降の)「叙述基本語の候補」として取り出した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上記(1)については、作業を完了した。 (2)については、2000年以降の社説各編をその話題によって〈国内〉〈国際〉〈外交〉〈経済〉〈社会〉の5層に分類し、各層のサイズ調整を行って、「社説サブコーパス」を作成するとともに、これに国立国語研究所『Web茶まめ』の短単位による語彙調査を施した。語彙表作成にあたっては、各短単位の語彙素読み・語彙素・品詞大分類・語種がすべて一致するものを同語(一つの見出し語)と認め、また、品詞大分類が「助詞」「助動詞」「補助記号」であるものは除いた。 (3)については、当初、語彙散布度として(分担者が開発した)「対数化特化係数レンジ」を用いることを考えていたが、対数化の際に設定する始数が散布度に必要以上の影響を与えてしまうことが判明したため、Gries(2008)が提案するDP(deviation of proportions)を採用して、(2)の各語の散布度を計測した。その上で、5層すべてに出現する語のうち、使用率と語彙散布度がいずれもそれぞれの中央値を上回るものを(2000年以降の)社説の「叙述基本語の候補」として取り出した。以下に、その散布度上位50語を示す。 <する、出来る、内容、有る、言う、今、欲しい、責任、得る、当然、取る、ない、来る、必要、また、その、含める、求める、始まる、深刻、居る(いる)、それ、感、物、はず、因る、結果、ため、国、続く、事、出る、状況、理由、厳しい、十分、行う、付ける、目指す、成る、見る、しかし、これ、主張、示す、信頼、可能、この、以上、対策>
|
Strategy for Future Research Activity |
最終年度の2024年度には、以下のことを行う。 (4)叙述基本語の質的分析:上記「叙述基本語の候補」の、コーパスにおける使用例を分析し、社説特有の言語的パターンとしての「叙述型」が認められたものを「社説の叙述基本語」とする。この作業は、研究代表者と分担者(※)が協同して行う。 (5)叙述基本語の成立過程の解明:上記の「社説の叙述基本語」について、『毎日新聞経年コーパス(第5版)』全体を用いて、その成立過程を記述・解明する。記述は、量的・質的の両面から行うが、前者については、各語の使用率・語彙散布度の平均変化率を求めることによってそれぞれの「叙述語化」を量的にとらえることを試みる。後者については、叙述語だけでなく、それぞれの類義語についてもその「叙述型」を見出して、社説という文章ジャンルにおける両者の文章論的機能の違いとその変化を明らかにすることを試みる。これらの作業は、研究代表者と分担者が協同して行う。 ※分担者の身分変更(定年退職)により、2024年度は「研究協力者」として参加
|
Report
(2 results)
Research Products
(8 results)