1.ソフトウェアの開発・改良 現代日本語の研究における大規模な電子化コーパスの利用を可能にするための各種のソフトウェアを開発・改良した。 新聞記事データベースCD-ROMから日本語テクストを読み出すためのソフトウェアは昨年度までに開発を完了していたが、今年度新規に作成したソフトウェアにより、『CD-ROM版 新潮文庫の100冊』や『INTERNET FOCUS ON CD-ROM』に含まれる日本語テクストもコーパスとして利用が可能になった。これで、検索・分析の対象範囲が、新聞記事という特定のジャンルから小説や雑誌記事の日本語にまで拡大されたことになる。 また、語句の用例を検索したり、検索結果を分析するための各種ソフトウェアを開発・改良した。特に、語句の用例の検索〜KWIC索引の生成〜前後の文脈に基づくソ-ト(並び替え)といった一連の処理を自動的に実行できるようにした。 2.事例研究 上記の各種ソフトウェアを利用して、現代日本語の文法・語彙の様々な現象についての分析を行った。種々の語句の用例を大量に検索し、ソフトウェアによる処理を利用して分析を試みることで、現実の言語事実に立脚した日本語の精密な記述を追求した。 3.コーパス言語学の方法論的考察 コーパスを用いた日本語研究の可能性と問題点について多角的に検討を加えた。また、新聞記事データベースの利用に関して著作権者である朝日新聞社と交渉を重ねる機会があり、今後言語研究者がコーパスを利用するうえで著作権の問題をどう考えるべきかについて研究・考察した。
|