研究課題/領域番号 |
08451093
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
国語学
|
研究機関 | 青山学院大学 |
研究代表者 |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
|
研究期間 (年度) |
1996 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
4,100千円 (直接経費: 4,100千円)
1998年度: 500千円 (直接経費: 500千円)
1997年度: 500千円 (直接経費: 500千円)
1996年度: 3,100千円 (直接経費: 3,100千円)
|
キーワード | KWIC / UNIX / WWW / コーパス / 文法 / データベース / データ処理 / 日本語 / ワークステーション |
研究概要 |
研究に必要なデータの処理のための環境としてUNIXワークステーションを用意し、開発環境の設定を行った。開発環境のテストはいくつかの処理系を用いて行ったが、最終的にはBSD UNIXを用いて今後の研究を行うことに決定した。またデータ処理言語としては、Perl言語を採用することを決定した。 次に、データとしては、主に市販されている新聞記事CDROMを用い、これらから10億語程度のデータを収集し、今回の研究で開発したKWICプログラムを用いた。またこれらのデータ処理によって文型のデータベースを作成し、必要な文法情報を収集した。 以上の中から得たデータを用いて、日本語の記述文法に必要な情報を重点的に集めて、いくつかの文法記述をテストケースとして行った。具体的には、現代日本語の名詞節、および指示詞の用法を研究し、それぞれを古典語と対比する形での文法記述として論文化し、公刊した。そのうちの一部より報告書を作成した。 また、以上の成果の公表のために、インターネット上にWWWサーバーを構築し、研究成果を公開する態勢を整えた。サーバーのURLは次の通りである。 http://klab.ri.aoyama.ac.jp 現在、このURLを通して、研究成果のうち、KWICプログラム、データの文字種類整列プログラムなどを公開しており、さらに今後公開の範囲を広げる予定である。
|