研究課題/領域番号 |
11551009
|
研究機関 | 東京都立大学 |
研究代表者 |
荻野 綱男 東京都立大学, 人文学部, 教授 (00111443)
|
研究分担者 |
熊谷 康雄 国立国語研究所, 情報資料部門, 部門長 (30215016)
真田 信治 大阪大学, 大学院・文学研究科, 教授 (00099912)
宮島 達夫 京都橘女子大学, 文学部, 教授 (30099915)
|
キーワード | 計量的研究 / 論文データベース / CD-ROM / 日本語研究 |
研究概要 |
1 計量的日本語研究論文をスキャナでスキャンしたものに対して、画像品質のチェックを全体的に行った。必要に応じて、不良部分を再度スキャンした。 2 モニター数名を募集し、試作段階のCD-ROMを先行配布し、どのように使えるか、どんな問題があるか、体験してもらった。年度末までにコメントを回収し、研究成果報告書に収録した。 3 「語彙」に関する計量的日本語研究論文の全体を概観し、計量言語学の観点から語彙研究を展望し、今後の語彙研究で必要となる点を考察した。 テキストを対象とした計量的な語彙研究を概観すると、異なり語数的なアプローチが多く、延べ語数的なアプローチが不十分である。それは、大規模な語彙調査が国立国語研究所とNHKだけで行われている現状を反映している。今後は、計算機を用いることで個人でも語彙調査が可能になっていくので、延べ語数的アプローチが多くなることを期待する。 多人数調査による計量的な語彙研究の面では、簡単な手法を用いたものや、数量化の諸手法など「データから何かを探ろうとする」アプローチが多く、仮説検証的な実験法によるアプローチがほとんどない。今後は、この方面の研究が多くなることが必要である。 4 収録予定の論文のタイトルや著者名などに含まれる「外字」について、全面的に見直し、単純テキストファイルで表現するとともに、外字をイメージで収録する方針でやっていけることを確認した。 5 年度末に研究成果報告書を作成した。
|