研究概要 |
1 ソフトウェアの開発・改良 現代日本語研究における電子化コーパスの利用を可能かつ容易にするための各種のソフトウェアを開発・改良した。 『CD-ROM版朝日新聞記事データベース』,『『CD-ROM版新潮文庫100冊』,^4『INTERNET FOCUS ON CD-ROM』などのCD-ROMに含まれるデータをコーパスとして利用できるようテクストファイル形式に変換するソフトウェアの開発は平成8年度までに一通り完了していたが,それらをいっそう使いやすいものとするため一部に改良を加えた。 また,コーパスから語句の用例を検索するソフトウェア,検索結果からKWIC索引を生成するソフトウェア,検索結果を一定の条件に基づいて自動的に分類するソフトウェアなどのソフトウェア群を開発・改良した。用例の検索・整理・分析処理にはさまざまな局面があるが,そのうち自動化を許すもについてはできるだけ人手を介することなく処理できるようにすることを目指した。 2 事例研究 上記の各種ソフトウェアを利用して,現代日本語の文法・語彙の様々な現象についての分析を行った。副詞や接続詞などを中心とする種々の語句の用例を検索しそれを分析することで,言語使用の実態に即した綿密な言語記述が可能になることを実証的に明かにした。内省や少数の用例だけに依存した研究方法ではなかなか見えてこない多くの興味深い事実がコーパスの分析によって見えてくることを示した。 3 コーパス言語学の方法論的考察 コーパスを用いた日本語研究の可能性と問題点について多角的に検討を加えた。特に,電子コーパスに含まれる誤りや問題点のタイプを調査・分析し,コーパスを言語研究に役立てるうえでどのような点に注意する必要があるかを考察した。
|