2021 Fiscal Year Research-status Report
Novels and Data Sciences: Mindscape Seen in Language
Project/Area Number |
20K20699
|
Research Institution | Kobe University |
Principal Investigator |
石川 慎一郎 神戸大学, 大学教育推進機構, 教授 (90320994)
|
Project Period (FY) |
2020-07-30 – 2023-03-31
|
Keywords | コーパス / 小説 / 日英比較 / マインドスケープ |
Outline of Annual Research Achievements |
【研究背景】ある国の小説は、当該国の母語話者が意識的・無意識的に継承する文化・風俗・精神・言語の表象であると考えられる。小説は、従来、文学研究の素材として考えられてきたが、「データサイエンス」の観点から見ると、小説は文化研究の新しいリソースとなりうる。たとえば、ランダムサンプリングされた日英米の小説資料を比較することで、各国の精神風景(マインドスケープ)を計量的に論じることも可能になる。こうした研究を行おうとする場合、重要になるのは、各国間で相互比較可能な小説コーパスを整備することである。日本語・英語ともに多くのコーパスが構築されているが、サンプリング基準をそろえて構築された相互比較可能な小説コーパスは存在しない。 【研究目的】本研究は、1961~2021年にかけて10年ごとにサンプリングポイントを決め、該当年に刊行された日本語小説テキストを収集し、英訳データとともにコーパスとして公開することを目標とする。あわせて、収集したデータを使い、日本語の時系列変化研究および、日本語と英語の小説の言語表現の比較研究を行う。 【進捗】2021年度においては、日本語小説データの収集と文字化、英語対訳データの生成、オンライン検索システムの開発と公開、関連論文の公刊、がなされた。 【公開物】コーパスは、「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)として公開されている。同システムは研究室で独自に開発したもので、KWIC検索・コロケーション検索・特徴語検索のほか、経年変化を概観する頻度グラフの自動作成機能を備える。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
2021年度においては、下記の進捗があった。 1) 日本語小説データの収集と文字化:3種の文芸誌より7か年分の作品データをサンプリングして収集。書き起こしししてテキスト化した。 2) 英語対訳データの生成:2種のAI型自動翻訳を用い、すべての作品について英訳データをを生成した。 3) オンライン検索システムの開発と公開:「1961-2021 Japanese General Fiction Corpus」(略称6121 JFIC)を構築・公開した。 4) 関連論文の刊行:関連学会での口頭発表および2本の論文公刊を行った。
|
Strategy for Future Research Activity |
当初の計画については順調に達成できている。最終年度においては、必要に応じてサンプルの追加、検索システムの機能強化、関連論文の執筆を進めていく予定である。また、今後の状況の推移の中で海外学会への参加がふたたび可能になれば、本研究成果の海外での発表も実現したい。
|
Causes of Carryover |
コロナの影響で予定していた海外出張などがなくなり、次年度使用額が生じたものである。3年目はコロナ影響の推移を確認しながら研究費の執行計画を調整予定である。
|
Research Products
(6 results)