研究課題/領域番号 |
20K20699
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 神戸大学 |
研究代表者 |
石川 慎一郎 神戸大学, 大学教育推進機構, 教授 (90320994)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2022年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
|
キーワード | 日英語比較 / 語彙分析 / 形態素解析 / 語彙表自動出力 / 多変量解析 / マインドスケープ研究 / 日本語コーパス / 小説コーパス / 日英対照研究 / 対照文体論 / 計量文体論 / コーパス / 小説 / 日英比較 / マインドスケープ / 英語 / 日本語 / 文学 / 日米対照 / 精神風景 |
研究開始時の研究の概要 |
小説は,その国の母語話者が意識的・無意識的に継承する文化・風俗・精神・言語の表象である。小説は,文学研究の対象であるが,「データサイエンス」の観点から見ると,文化研究の新しいリソースでもありうる。ランダムサンプリングされた日米の小説資料を比較することで,両国の精神風景(マインドスケープ)を計量的に論じることが可能になる。本研究では,米語コーパスの原型とされるBrown Corpusの「小説セクション」のサンプリング基準を日本語に適用し,Brownと比較可能な日本語均衡小説コーパスを構築した上で,日米小説データの言語分析に基づく計量的マインドスケープ比較を試行しようとするものである。
|
研究実績の概要 |
「言語から見た日米マインドスケープ比較」や日英対訳データを用いた「データサイエンス志向型小説研究」を可能にする基盤的なツールとして、複数の英語テキストと日本語テキストから、基本的な語彙処理(形態素切り分け、品詞認定)を行ったうえで、書字形レベルと語彙素レベルの2階層で、統合語彙表を自動作成して出力する「English/Japanese Word Frequency Table Generator(EJWFTG)を開発し、一般公開することができた。 EJWFTGを用いれば、たとえば、日本語や英語の小説100本から、そこで使用されたすべての語について、各作品での使用頻度を一覧で出力することができる。こうして得られた語彙表を観察することで、頻度だけでなく、レンジ(当該語が出現するテキスト数またはその比率)をふまえた基本語の検討が可能になる。また、得られた語彙表は、多変量解析の基礎データにもなるもので、たとえば対応分析や多次元尺度法などを用いて、語と作品の関係を明らかにしたりすることも可能になる。 今後、EJWFTGを用いた日英語の比較研究や、語彙分析を糸口とするマインドスケープ比較研究に使用されることが期待される。なお、EJWFTGの開発理念と使用法の詳細、また、EJWFTGが可能にする新しいコーパス研究の可能性については、2024年3月に刊行された論文「「森を見ながら木を見る」コーパス研究の意義 : 複数テキストから統合語彙頻度表を作成するEJWFTGの開発」において詳述されている。
|