研究概要 |
(1) 本研究は,電子化された大規模な言語コーパスから得られる大量の用例を用いて文法形式や文法構造の特徴を記述する際に不可欠な,「評価資料」となる言語データのサンプル化の方法論を整備することを目的としている。 (2) 具体的には,フィンランド語の大規模コーパス(フィンランド学術計算機センター提供の「フィンランド語バンク」)を用い,フィンランド語の語彙・文法情報をデータベース化し,(1)文法情報の種類と統計分析に必要なサンプルサイズの関係の考察(2)文法情報のデータ構造の検討と最適な統計処理の手法の開発(3)最新のコーパス言語学で用いられるコロケーション分析の手法をはじめとする語彙分析とサンプル化による文法情報の分析の関係の考察をおこなうものである。
|