2021 Fiscal Year Annual Research Report
昭和・平成書き言葉コーパスによる近現代日本語の実証的研究
Project/Area Number |
19H00531
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (20337489)
|
Co-Investigator(Kenkyū-buntansha) |
小椋 秀樹 立命館大学, 文学部, 教授 (00321547)
間淵 洋子 和洋女子大学, 人文学部, 准教授 (10415614)
高橋 雄太 明治大学, 国際日本学部, 助教 (20840193)
近藤 明日子 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 研究員 (30425722)
松田 謙次郎 神戸松蔭女子学院大学, 文学部, 教授 (40263636)
永澤 済 名古屋大学, 国際機構, 准教授 (50613882)
持橋 大地 統計数理研究所, 数理・推論研究系, 准教授 (80418508)
田中 牧郎 明治大学, 国際日本学部, 専任教授 (90217076)
金 愛蘭 日本大学, 文理学部, 准教授 (90466227)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | コーパス / 日本語史 / 言語変化 / 形態論情報 / 近現代語 / 言語資源 / 自然言語処理 |
Outline of Annual Research Achievements |
国立国語研究所を中心とするコーパス構築班と、研究分担者の全員が参加するコーパス応用班とで研究活動を行った。 コーパス構築班では、構築を進めて予定しているコーパス(1933年から2013年までの8年おき11年分の雑誌・新聞・ベストセラー書籍)のデータ作成のうち、雑誌と大部分のベストセラー書籍・新聞についてテキスト入力・XMLによる文書構造アノテーションを終え、形態素解析を行ってデータの整備・未知語の辞書登録作業を実施した。 コーパス応用班では、国語研「通時コーパス」プロジェクトとの共催によるシンポジウムを含めて3回の研究会を開催し、近現代日本語の表記・語彙・文法変化に関する研究発表を行った。 言語変化の統計モデリングについては、国立国語研究所新領域創出型プロジェクト「現代語の意味の変化に対する計算的・統計力学的アプローチ」と共同で研究を行ない3月に「現代語の意味の変化に対する 計算的・統計力学的アプローチ」 シンポジウムを開催したほか、言語処理学会において2件の研究発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
公開用サーバーの購入など環境の整備に時間を要したため、雑誌の先行公開は見送ったものの、コーパス整備全体では概ね予定通りに進捗している。 共催も含めて3回の研究発表会を行い、研究成果についても十分に発表することができた。
|
Strategy for Future Research Activity |
コーパス構築班においては、現在の計画を継続し、雑誌・ベストセラー書籍・新聞のコーパス構築について、特に形態論情報の整備を中心に継続する。また、コーパス公開環境の準備をすすめ、年度末に『昭和・平成書き言葉コーパス』としての公開に備える。 コーパス応用班では、研究発表会を年2回程度開催するほか、国立国語研究所の「通時コーパス」プロジェクト等の関連研究との共同研究も実施し、論文・学会発表による研究成果の発信に努める。
|
Research Products
(10 results)