• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

Novels and Data Sciences: Mindscape Seen in Language

Research Project

Project/Area Number 20K20699
Research InstitutionKobe University

Principal Investigator

石川 慎一郎  神戸大学, 大学教育推進機構, 教授 (90320994)

Project Period (FY) 2020-07-30 – 2023-03-31
Keywordsコーパス / 小説 / 日英比較 / マインドスケープ
Outline of Annual Research Achievements

【研究背景】ある国の小説は、当該国の母語話者が意識的・無意識的に継承する文化・風俗・精神・言語の表象であると考えられる。小説は、従来、文学研究の素材として考えられてきたが、「データサイエンス」の観点から見ると、小説は文化研究の新しいリソースとなりうる。たとえば、ランダムサンプリングされた日英米の小説資料を比較することで、各国の精神風景(マインドスケープ)を計量的に論じることも可能になる。こうした研究を行おうとする場合、重要になるのは、各国間で相互比較可能な小説コーパスを整備することである。日本語・英語ともに多くのコーパスが構築されているが、サンプリング基準をそろえて構築された相互比較可能な小説コーパスは存在しない。
【研究目的】本研究は、1961~2021年にかけて10年ごとにサンプリングポイントを決め、該当年に刊行された日本語小説テキストを収集し、英訳データとともにコーパスとして公開することを目標とする。あわせて、収集したデータを使い、日本語の時系列変化研究および、日本語と英語の小説の言語表現の比較研究を行う。
【進捗】2021年度においては、日本語小説データの収集と文字化、英語対訳データの生成、オンライン検索システムの開発と公開、関連論文の公刊、がなされた。
【公開物】コーパスは、「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)として公開されている。同システムは研究室で独自に開発したもので、KWIC検索・コロケーション検索・特徴語検索のほか、経年変化を概観する頻度グラフの自動作成機能を備える。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

2021年度においては、下記の進捗があった。
1) 日本語小説データの収集と文字化:3種の文芸誌より7か年分の作品データをサンプリングして収集。書き起こしししてテキスト化した。
2) 英語対訳データの生成:2種のAI型自動翻訳を用い、すべての作品について英訳データをを生成した。
3) オンライン検索システムの開発と公開:「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)を構築・公開した。
4) 関連論文の刊行:関連学会での口頭発表および2本の論文公刊を行った。

Strategy for Future Research Activity

当初の計画については順調に達成できている。最終年度においては、必要に応じてサンプルの追加、検索システムの機能強化、関連論文の執筆を進めていく予定である。また、今後の状況の推移の中で海外学会への参加がふたたび可能になれば、本研究成果の海外での発表も実現したい。

Causes of Carryover

コロナの影響で予定していた海外出張などがなくなり、次年度使用額が生じたものである。3年目はコロナ影響の推移を確認しながら研究費の執行計画を調整予定である。

  • Research Products

    (6 results)

All 2022 2021 Other

All Journal Article (2 results) Presentation (3 results) Remarks (1 results)

  • [Journal Article] 時代変種と学習者変種の観点から考える日本語終助詞―時系列日本語小説コーパス「6121JFIC 」と国際日本語学習者コーパス「I JAS」を用いた統合分析の試み2022

    • Author(s)
      石川慎一郎
    • Journal Title

      統計数理研究所共同研究リポート

      Volume: 456 Pages: 73-88

  • [Journal Article] 「1961-2021日本語小説コーパス」の構築―日英小説対照研究の新しい可能性―2021

    • Author(s)
      石川慎一郎
    • Journal Title

      英語コーパス学会大会予稿集

      Volume: 2021 Pages: 7-12

  • [Presentation] 日本語学習者データと日本語時系列データが出会うとき:I-JASと6121JFICの統合分析の試みー終助詞をめぐって-2022

    • Author(s)
      石川慎一郎
    • Organizer
      学習者コーパス研究会2022年2月例会
  • [Presentation] 経年的日本語小説コーパス「6121JFIC」の開発と公開-日本語時系列分析の新しいリソースとして-2022

    • Author(s)
      石川慎一郎
    • Organizer
      統計数理研究所「計量的コーパス研究の展望2022」
  • [Presentation] 「1961-2021日本語小説コーパス」の構築―日英小説対照研究の新しい可能性―2021

    • Author(s)
      石川慎一郎
    • Organizer
      英語コーパス学会第47回大会
  • [Remarks] 6121JFICコーパス紹介ページ

    • URL

      http://language.sakura.ne.jp/jfic/guide.html#

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi