本研究の目的は、現代日本語の記述的文法・意味研究を発展させるために必要不可欠な、テーマ別データベースを作成するとともに、それに基づいた分析方法の開発を行うものである。従って研究は、(1)電子化テキスト及びテーマ別データベースの作成、(2)分析方法の開発と考察、の二つの段階から成る。 (1)のデータベース作成については、説明文・論説文の電子化テキストを作成するため、昭和20年代以降現代までの著作・論文等から、時代・ジャンル・思想・文体・執筆者等に偏りがないよう配慮しながら、良質なテキストを今年度も50冊程度選定した.そして昨年度同様、スキャナとOCRソフトを用いてそれらを電子化し、ある程度テキストが蓄積した時点で検索ソフトによって表現を検索しながら、必要な文脈を付してデータベースソフトでデータベースを作成する、という作業を繰り返した。また、多様な資料をデータベース化する必要から、本年度は、信頼のおける新聞社等が配信している、インターネット上の情報からも説明文・論説文を収集した。そのため、昭和20年代以降各年代まんべんなく、としていた当初の計画より、今現在の言語資料の比重が増している。 (1)のデータベース作成作業と並行して、本年度も(2)の分析方法の開発と考察を行った。分析対象とする接続表現・文末表現・引用表現・連体修飾構造の各テーマについて、先行研究の到達点や問題点を踏まえながら、分析の基準・観点を確立するために、個々の表現について最も適切な分析方法を模索する作業を親けた。深く考察することのできた表現は限られ、現在のところ、必ずしも満足な結果が得られているとは言えないが、今後の研究の基盤となる大きな枠組を設定することはできたと思われる。研究期間終了後もこの(2)の作業は継続し、分析の精度を高めていくと同時に、その成果をいろいろな形で公表していく予定である。
|