2007 Fiscal Year Annual Research Report
Project Area | Compilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics |
Project/Area Number |
18061006
|
Research Institution | Nihon University |
Principal Investigator |
荻野 綱男 Nihon University, 文理学部, 教授 (00111443)
|
Co-Investigator(Kenkyū-buntansha) |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
矢澤 真人 筑波大学, 人文社会科学研究科, 准教授 (30182314)
丸山 直子 東京女子大学, 文理学部, 教授 (00199936)
|
Keywords | 国語辞典 / コーパス / 意味論 / 文法論 / コロケーション / 複合辞 / 意味区分 / 役割の二格 |
Research Abstract |
4グループに分かれて研究活動を行った。各グループとも、コーパスを用いた辞書の作成を念頭に置いて研究を進めた。 第1グループでは、コロケーション(語と語の共起関係)の性質を調べるためにアンケート調査を行った。その結果、コロケーションの自然さと使用度に関連があること、コロケーションの自然さに対して、修飾語句の有無が影響を与えること、WWWでよく使われるコロケーションが自然だと意識されることなどがわかった。これらのことから、コロケーションの辞書を記述・作成するために配慮するべきポイントが明らかになった。また、一部の項目に対して試行的な辞書記述を行った。 第2グループでは、複合辞の辞書を作成するために、まず、コーパスからどのようにして複合辞を抜き出すかという研究を行った。n-gramの考え方を採用し、T-scoreとMI-scoreを組み合わせて自動判定する方法を確立した。 第3グループでは、国語辞典の形容詞の意味記述がいくつに分かれているかを調べ、コーパス中の実例がそれぞれどの区分に該当するかを被験者に判定させた。その結果、かたり一致するところもあるものの、不一致なところや、どこにも当てはまらないところなどがあることがわかった。そういうところは辞書中の意味の区分のしかたに問題がある場合が多いことがわかった。 第4グループでは、「役割の二格」といわれる現象を取り上げ、国語辞典の中で動詞の格情報の記述としてどのようなものがのぞましいかという点を検討した。過去の研究でもとらえ方がさまざまであり、不十分な扱いしかされてこなかったことがわかった。さらに、辞書記述のために、どんなふうにコーパスを利用するかを検討し、二格成分と名詞分類を利用して、ある程度自動的に多数の用例を抽出できるようになった。
|