研究概要 |
本研究では、日本語研究における電子化資料の効果的な用い方を目的として、コーパスの試作と活用に関する研究を行った。 1.コーパスの作成に関する準備的研究 (1)どのようなデータを集めればよいかということについて、ジャンルを考慮したバランストコーパスの設計のための要件について検討した。(加藤安彦,「コーパスと辞典にとっての新世紀」,日本語学20-1)。(2)日本語研究文献におけるコーパス利用の実態について調査し、実例と作例の割合、その利用のされ方について報告した(山崎誠,「文法研究と用例-実例と作例の割合」日本語学19-6)(3)コーパスを共有するための言語単位の問題の解決が必要であることを指摘した。(加藤・山崎「標準化動向・共通利用単位としてのβ単位」,社団法人日本電子工業振興協会・JEIDA自然言語処理システムに関するシンポジウム,2000年6月23日)(4)文型コーパスとして活用できる資料として英和辞典の語義記述を取り上げた。(日本語文型研究資料としての英和辞書の活用-小学館『プログレッシブ英和中辞典』(第3版)の動詞の意味記述の利用(山崎誠,JACET英語辞書研究会第3回ワークショップ,1999年12月11日) 2.コーパスの試作に関して 当初,資料の収集範囲を,文体やジャンルを考慮し,かたよりのないものと考えていたが,急速な電子化資料の普及で,新聞・小説はすでに生コーパスに近いものが容易に入手できると判断した。そこで,本研究では,これまであまり入手できにくい資料を対象に収集することにし,その資料の文体的な特徴を明らかにすることに重点を移した。具体的には,映画やドラマのシナリオである。シナリオは話されることを目的にした書き言葉であり,書き言葉の中では話し言葉に近い位置にあるものである。入力した分量は以下の通り。映画のシナリオ28作品(83万字),テレビドラマのシナリオ23作品(45万字),その他随筆など14作品(111万字),合計239万字。 3.コーパスの活用法についての研究 (1)必要な用例を適切に抜き出すための方策の探求。(2)コーパスによる文法的類義表現の分析。 上記2点に関連して以下の発表を行った。 山崎誠(2001)「大規模用例処理に基づく文法記述研究の現在」(第30回中部日本・日本語学研究会,11月1O日,岐阜聖徳学園大学) 山崎誠(2001)「コーパスの言語学的基礎」(第6回「太陽」研究会,年11月30日,国立国語研究所) 田野村忠温(2002)「形容動詞連体形における「な/の」選択の一要因-「有名な」と「無名の」-」,「計量国語学」23-4
|