研究課題/領域番号 |
16K02739
|
研究機関 | 法政大学 |
研究代表者 |
尾谷 昌則 法政大学, 文学部, 教授 (10382657)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 日本語 / 口語資料 / コーパス |
研究実績の概要 |
「ことばの乱れ」を嘆く声はどの時代にも存在するが、その全てが誤用というわけではなく、中には言語学的に見て妥当な変化(もしくは、変化したことに対して一定の理解が得られる変化)と考えてもよい事例が存在する。そのような言語変化のメカニズムを解明すべく、本研究は、(1)昭和期の言語資料(対談など)を大量にスキャン&電子データ化し、そのデータに基づいて、(2)口語文法の変化に関して、定量的な観点から4つの事例研究を実施した上で、(3)「妥当な言語変化」を説明するモデルとして、Langacker(2000, 2008)の動的用法基盤モデルを改良した「類推ネットワーク・モデル」にてその言語変化を記述・説明する、という3つの目的を設定した。昭和初期の言語データについては、青空文庫等の小説データなどが既に無料で利用可能であるが、小説のようなメディアはたとえ会話文であっても極めて保守的な表現が多く、言語変化の発端となるような使用例は得られない。しかし本研究で収集する対談・インタビュー記事は、校正の手が入っている可能性もあるが、実際に発話された言葉遣いに近い資料であり、まとまった量の文脈も伴うデータなので、貴重な研究資料となる。 平成28年度は、上記目標の①を達成すべく、昭和初期の対談・インタビュー資料の収集とデータ化に取り組んだ。具体的には、復刻版『キネマ旬報』第562~735号(昭和11年1月~昭和15年12月)までの5年分のデータ化である。同時に、書籍化されている対談集も収集したが、こちらはデータ化が完了していない。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の計画では、平成28年度は本研究の土台となるデータベース構築に費やす予定であった。具体的には、大正から昭和にかけての口語資料となる対談・インタビュー記事が掲載されている古雑誌・書籍を購入し、スキャナでパソコンに取り込んだのち、OCR処理を行い画像をテキストデータ化するというものである。そこで、それらを収集すべく、復刻版『キネマ旬報』を購入したが、単価が高く、予算額の範囲内で全てを購入することができなかった。というわけで、5年分(計174冊)を購入し、それらをテキストデータ化したのだが、対談やインタビューのページが意外に少なく、データ量が絶対的に不足していると感じたため、単行本として市販されている対談集を追加で購入し、現在、こちらのデータ化に取り組んでいる。平成28年度中にデータ化したいと考えていた目標データ量にはまだ到達していないため、進捗状況は「やや遅れている」と言わざるを得ない。
|
今後の研究の推進方策 |
目標のデータ量を収集するために、平成29年度の前半は対談集(単行本)のデータ化作業を継続するとともに、効率はかなり下がるが図書館等に所蔵されている古雑誌の対談・インタビュー部分のテキストデータ化に取り組みたい。幸い、今年度はサバティカルがとれたため、この作業に多くの時間を割くことができると思われる。 それらのデータ化をなるべく夏までに完了し、その後は、予定していた「なので」「案外と(に)」「っていうか」「基本(的に)」の調査に入る。これらの中から、最も多く用例が収集できた表現に絞って、秋から冬にかけてじっくりと調査・分析を行う予定である。
|
次年度使用額が生じた理由 |
口語データを収集するために、『キネマ旬報』(復刻版)を20年分購入予定であったが、配分額を全て費やしても9年分しか購入できないことが判明した。また、『キネマ旬報』は、価格の割に得られる口語データが少なかったので、購入を配分額の約半分(5年分、計174冊)でとどめ、それ以外に対談やインタビューなどの口語資料がより効率よく得られそうな雑誌・書籍を購入するために、予算を残しておいた。
|
次年度使用額の使用計画 |
現在、『キネマ旬報』よりもさらに効率よく口語データが収集できそうな雑誌・書籍を調査中である。書籍に関しては、単行本化された対談集などを購入予定である。雑誌に関しては、復刻されているものはどれも高額なため、得られるデータ量と価格を考慮しながら慎重に選定を進めているところである。
|