研究課題/領域番号 |
20K20699
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 神戸大学 |
研究代表者 |
石川 慎一郎 神戸大学, 大学教育推進機構, 教授 (90320994)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2022年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | コーパス / 日英対照分析 / イメージ研究 / マインドスケープ研究 / 自動語彙分析 / 計量的テキスト分析 / 日英語比較 / 語彙分析 / 形態素解析 / 語彙表自動出力 / 多変量解析 / 日本語コーパス / 小説コーパス / 日英対照研究 / 対照文体論 / 計量文体論 / 小説 / 日英比較 / マインドスケープ / 英語 / 日本語 / 文学 / 日米対照 / 精神風景 |
研究開始時の研究の概要 |
小説は,その国の母語話者が意識的・無意識的に継承する文化・風俗・精神・言語の表象である。小説は,文学研究の対象であるが,「データサイエンス」の観点から見ると,文化研究の新しいリソースでもありうる。ランダムサンプリングされた日米の小説資料を比較することで,両国の精神風景(マインドスケープ)を計量的に論じることが可能になる。本研究では,米語コーパスの原型とされるBrown Corpusの「小説セクション」のサンプリング基準を日本語に適用し,Brownと比較可能な日本語均衡小説コーパスを構築した上で,日米小説データの言語分析に基づく計量的マインドスケープ比較を試行しようとするものである。
|
研究成果の概要 |
異言語資料を用いた計量的マインドスケープ比較研究の基盤整備を行うべく、 (1)既存英米コーパスの小説モジュールと比較できるよう、三大文芸誌より日本語小説データを収集した。(2)言語学的解析を可能にする品詞タグ付けを実施し、専門家による修正を行った。(3)2種のAI翻訳で全日本語テキストに英訳付与を行った。(4)著作権処理を経て「6121JFIC」コーパスを公開した。(5)英語・日本語の複数テキストデータに対して自動で形態素解析を行い、統合頻度表を出力するEJWFTGを2023年度末に開発・公開した。同様の試みは過去に例が僅少で、新しい人文テキスト研究の可能性を広げる一助になると思われる。
|
研究成果の学術的意義や社会的意義 |
伝統的な文学研究や、各種のイメージ研究、マインドスケープ(心象風景)研究は、分析者の主観に依存する部分が大きく、研究手法の記録と管理、また、研究結果の再現性の保証という点で、制約が多かった。本研究課題では、まずもって、日本語小説を時系列的に収集した新しい言語資源として6121JFICを構築したことで、既存の英米の小説コーパスと対照研究を行う素地が確立された。さらには、EJWFTGの開発とリリースにより、文芸テキストに限らず、日本語・英語の様々な言語テキストをオンライン上で単語レベルで解析し、統合語彙表を自動生成する環境が構築された。これらは、テキスト研究のさらなる発展の一助となりうる。
|