• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

WWWを日本語コーパスとして使うための基礎的研究

研究課題

研究課題/領域番号 17520304
研究機関日本大学

研究代表者

荻野 綱男  日本大学, 文理学部, 教授 (00111443)

キーワードWWW / 検索エンジン / 日本語コーパス / 話しことば / 書きことば
研究概要

検索エンジンで日本語の実態を把握するために研究を行った。
第1に、田野村氏が新聞5年分のCD-ROMを使って行った研究を、WWWをコーパスとして使って、再調査した。すると、WWWの言語量の膨大さが活きてきて、新聞から得られた結果をはるかにしのぐ成果が得られた。たとえば、田野村氏の研究では用例数が少なくて何ともいえないような結果になっていたところを、確実に言えるようになったことなどが挙げられる。
第2に、文法関連のいくつかの先行研究を追試してみた。その結果、必ずしも同じ結果になるわけでなく、先行研究が間違っていることがわかった例もたくさんある。こうして、WWWがコーパスとして十分使い物になることがわかった。
第3に、WWWの中の、特にブログについていえることであるが、書き手の男女差を手がかりに、さまざまな単語が男性・女性のどちらによって使われているかを求め、単語の「男女度」を求めることができた。「おふくろ」などは男性が使うことが多く、「あら」などは女性が使うことが多いという結果である。この手法を用いることで、さらに多くの単語について、男女度を求めることができる。この研究は、WWWを用いた単語の意味論的研究と位置づけられるものである。
これらの例が示すように、、WWWは言語研究の資料として十分実用的に利用できることがわかった。
次年度以降も、さらに多用な応用例を開発していく予定である。

  • 研究成果

    (5件)

すべて 2006

すべて 雑誌論文 (5件)

  • [雑誌論文] 国語辞書の記述内容と言語使用の現状の異同2006

    • 著者名/発表者名
      荻野綱男
    • 雑誌名

      日本語辞書学の構築

      ページ: 37-48

  • [雑誌論文] 検索エンジンGoogleの使い方とWWWコーパスによる日本語研究2006

    • 著者名/発表者名
      荻野綱男
    • 雑誌名

      実験音声学と一般言語学

      ページ: 528-537

  • [雑誌論文] WWWによる単語の文体差の研究2006

    • 著者名/発表者名
      荻野綱男
    • 雑誌名

      日本語学会2006年度秋季大会予稿集

      ページ: 139-146

  • [雑誌論文] 形容動詞連体形における「な/の」選択について-田野村氏の結果をWWWで調べる-2006

    • 著者名/発表者名
      荻野綱男
    • 雑誌名

      計量国語学 Vol. 25, No. 7

      ページ: 309-318

  • [雑誌論文] WWWの検索による日本語研究(2)2006

    • 著者名/発表者名
      荻野綱男, 末永絵梨, 下重秋弓, 三好亜萌
    • 雑誌名

      東京女子大学日本文学 103号

      ページ: 147-166

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi