研究領域 | 代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備 |
研究課題/領域番号 |
18061006
|
研究機関 | 日本大学 |
研究代表者 |
荻野 綱男 日本大学, 文理学部, 教授 (00111443)
|
研究分担者 |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
矢澤 真人 筑波大学, 人文社会科学研究科, 教授 (30182314)
丸山 直子 東京女子大学, 現代教養学部, 教授 (00199936)
|
キーワード | コーパス / 国語辞典 / 辞書記述 / コロケーション |
研究概要 |
(1)第1グループは、WWWを資料としてコロケーション情報を取り出す際の問題点を検討した。その結果、検索エンジンによって用例の分析結果にも微妙な影響を与えることがわかった。また、GoogleのN-gramデータからコロケーション情報を整理し、動詞と名詞のコロケーションについて基礎データを抽出・分類した。 (2)第2グループは、「BCCWJ複合辞辞書」(Ver.1.0)を作成した。エクセルによるデータベースとなっているが、それ以外に、複合辞辞書(印刷版)も作成した。印刷版では、小見出し925個を見出し語として掲出してある。特に接続詞は、自立語でありながら、複合辞としてもよい部分もあるという結論に至った。 (3)第3グループは、最終年度報告書の作成を進め,自他両用漢語動詞辞典を作成した。あわせて,研究成果の公開を進めた。 (4)第4グループは、動詞の格情報の辞書記述について研究し、コーパスにおける使用実態を、実際に岩波国語辞典第七版に反映させた。動詞の格情報についてもオノマトペについても、コーパスの情報を踏まえた辞書を試作した。基礎的な動詞の格情報の記述にはBCCWJがかなり有効だが、オノマトペの記述には不十分であることが明らかになった。文法的事項と語彙的事項の差と言えるかもしれない。
|