日仏語の大規模コーパスをもとに100万件規模のNグラムデータベースを構築した。このデータを対象に、種々のコロケーション指標を評価し、頻度結合の強度(Log-r)により2グラムの特徴付けが可能であることを示した。 同時に、データの観察により、以下の言語事象を発見し、コーパスに基づき詳細に記述・説明した。1)フランス語の「名詞+名詞」と「名詞+de+名詞」間の変化と変異、2) フランス語の「femme+人間名詞」の語順は、後続名詞の女性名詞化のためのfemmeの接頭辞化に由来、3)フランス語の親族や王・王妃などを表す名詞の形容詞化において性別が文法上の性として機能する現象。
|