• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

言語から見た日米マインドスケープ比較:データサイエンス志向型小説研究の試行

研究課題

研究課題/領域番号 20K20699
研究機関神戸大学

研究代表者

石川 慎一郎  神戸大学, 大学教育推進機構, 教授 (90320994)

研究期間 (年度) 2020-07-30 – 2023-03-31
キーワードコーパス / 小説 / 日英比較 / マインドスケープ
研究実績の概要

【研究背景】ある国の小説は、当該国の母語話者が意識的・無意識的に継承する文化・風俗・精神・言語の表象であると考えられる。小説は、従来、文学研究の素材として考えられてきたが、「データサイエンス」の観点から見ると、小説は文化研究の新しいリソースとなりうる。たとえば、ランダムサンプリングされた日英米の小説資料を比較することで、各国の精神風景(マインドスケープ)を計量的に論じることも可能になる。こうした研究を行おうとする場合、重要になるのは、各国間で相互比較可能な小説コーパスを整備することである。日本語・英語ともに多くのコーパスが構築されているが、サンプリング基準をそろえて構築された相互比較可能な小説コーパスは存在しない。
【研究目的】本研究は、1961~2021年にかけて10年ごとにサンプリングポイントを決め、該当年に刊行された日本語小説テキストを収集し、英訳データとともにコーパスとして公開することを目標とする。あわせて、収集したデータを使い、日本語の時系列変化研究および、日本語と英語の小説の言語表現の比較研究を行う。
【進捗】2021年度においては、日本語小説データの収集と文字化、英語対訳データの生成、オンライン検索システムの開発と公開、関連論文の公刊、がなされた。
【公開物】コーパスは、「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)として公開されている。同システムは研究室で独自に開発したもので、KWIC検索・コロケーション検索・特徴語検索のほか、経年変化を概観する頻度グラフの自動作成機能を備える。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

2021年度においては、下記の進捗があった。
1) 日本語小説データの収集と文字化:3種の文芸誌より7か年分の作品データをサンプリングして収集。書き起こしししてテキスト化した。
2) 英語対訳データの生成:2種のAI型自動翻訳を用い、すべての作品について英訳データをを生成した。
3) オンライン検索システムの開発と公開:「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)を構築・公開した。
4) 関連論文の刊行:関連学会での口頭発表および2本の論文公刊を行った。

今後の研究の推進方策

当初の計画については順調に達成できている。最終年度においては、必要に応じてサンプルの追加、検索システムの機能強化、関連論文の執筆を進めていく予定である。また、今後の状況の推移の中で海外学会への参加がふたたび可能になれば、本研究成果の海外での発表も実現したい。

次年度使用額が生じた理由

コロナの影響で予定していた海外出張などがなくなり、次年度使用額が生じたものである。3年目はコロナ影響の推移を確認しながら研究費の執行計画を調整予定である。

  • 研究成果

    (6件)

すべて 2022 2021 その他

すべて 雑誌論文 (2件) 学会発表 (3件) 備考 (1件)

  • [雑誌論文] 時代変種と学習者変種の観点から考える日本語終助詞―時系列日本語小説コーパス「6121JFIC 」と国際日本語学習者コーパス「I JAS」を用いた統合分析の試み2022

    • 著者名/発表者名
      石川慎一郎
    • 雑誌名

      統計数理研究所共同研究リポート

      巻: 456 ページ: 73-88

  • [雑誌論文] 「1961-2021日本語小説コーパス」の構築―日英小説対照研究の新しい可能性―2021

    • 著者名/発表者名
      石川慎一郎
    • 雑誌名

      英語コーパス学会大会予稿集

      巻: 2021 ページ: 7-12

  • [学会発表] 日本語学習者データと日本語時系列データが出会うとき:I-JASと6121JFICの統合分析の試みー終助詞をめぐって-2022

    • 著者名/発表者名
      石川慎一郎
    • 学会等名
      学習者コーパス研究会2022年2月例会
  • [学会発表] 経年的日本語小説コーパス「6121JFIC」の開発と公開-日本語時系列分析の新しいリソースとして-2022

    • 著者名/発表者名
      石川慎一郎
    • 学会等名
      統計数理研究所「計量的コーパス研究の展望2022」
  • [学会発表] 「1961-2021日本語小説コーパス」の構築―日英小説対照研究の新しい可能性―2021

    • 著者名/発表者名
      石川慎一郎
    • 学会等名
      英語コーパス学会第47回大会
  • [備考] 6121JFICコーパス紹介ページ

    • URL

      http://language.sakura.ne.jp/jfic/guide.html#

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi