日本語研究のための資料として、WWWを用いるためのいくつかの手法を開発した。 その中の一つは、ブログを利用して日本語の男女差を見ようというものである。 「あたし」はほぼ女性が使用し、[おれ、ぼく」はほぼ男性が使用することを利用して、男女差がありそうな単語多数と「あたし、ぼく、おれ」が共起する程度を、WWWを検索して求め、その頻度の偏りに基づいて、それぞれの単語の「男女度」を明らかにした。 すでに、男女差があるといわれる単語(つまり、男性あるいは女性に偏って使われる単語)を対象にして調べた限りでは、比較的うまくいくことがわかった。しかし、小さな男女差しかなく、判定が微妙な場合では、WWWを資料として調べても、いい結果にならなかった。 一方、今まで気づかれなかったような男女差を新たに発見したこともある。いずれも使用頻度の偏りがあり、それは男女別の話題の選択に関連しているのだが、今までは一般に男女差として意識されなかったような単語であった。 この結果から、WWWは、男女差を調べるような、社会言語学的な研究にも利用可能であることが明らかとなった。
|