2008 Fiscal Year Annual Research Report
Project Area | Compilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics |
Project/Area Number |
18061006
|
Research Institution | Nihon University |
Principal Investigator |
荻野 綱男 Nihon University, 文理学部, 教授 (00111443)
|
Co-Investigator(Kenkyū-buntansha) |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
矢澤 真人 筑波大学, 人文社会科学研究科, 准教授 (30182314)
丸山 直子 東京女子大学, 文理学部, 教授 (00199936)
|
Keywords | コーパス / コロケーション / 国語辞典 / 辞書記述 |
Research Abstract |
4グループに分かれて研究を行った。 (1)第1グループは、コロケーション辞書を作成するためにコーパスからコロケーション情報を抽出する方法を検討するとともに、辞書記述のためのコーパスの質の問題を研究し、特にコーパス中の間違いをどのように扱うべきかを検討した。 (2)第2グループは、特定領域内で利用に供されたコーパスBCCWJ 2008.7版を用いて、N-gramを抽出する実験を行った。その結果、25万種程度のN-gramを抽出することができた。その後、その中の複合辞とみられるものを抽出するアルゴリズムについて考察した。 (3)第3グループは、2種類の国語辞典のブランチ分けを用い、400例あまりの用例がどのブランチに当てはまるかを4人の被験者が判断する実験を行った。その結果、国語辞典の意味記述として問題がある例を多数見つけることができた。 (4)第4グループは、動詞の格情報を記述する観点から、BCCWJ 2008.7版を用いて岩波国語辞典第6版の例文を見直す作業を行った。その結果、国語辞典の記述が一貫していない部分を多数検出することができた。その上で、具体的な例文から辞書に収録する例文のあり方に関して考察した。
|
Research Products
(3 results)