2009 Fiscal Year Self-evaluation Report
Building a Balanced Database of the Finnish Morpho-syntax Using Large Corpora of Finnish
Project/Area Number |
19720100
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Linguistics
|
Research Institution | Reitaku University |
Principal Investigator |
CHIBA Shioju Reitaku University (70337723)
|
Project Period (FY) |
2007 – 2010
|
Keywords | 統語論 / コーパス言語学 |
Research Abstract |
(1) 本研究は,電子化された大規模な言語コーパスから得られる大量の用例を用いて文法形式や文法構造の特徴を記述する際に不可欠な,「評価資料」となる言語データのサンプル化の方法論を整備することを目的としている。 (2) 具体的には,フィンランド語の大規模コーパス(フィンランド学術計算機センター提供の「フィンランド語バンク」)を用い,フィンランド語の語彙・文法情報をデータベース化し,(1)文法情報の種類と統計分析に必要なサンプルサイズの関係の考察(2)文法情報のデータ構造の検討と最適な統計処理の手法の開発(3)最新のコーパス言語学で用いられるコロケーション分析の手法をはじめとする語彙分析とサンプル化による文法情報の分析の関係の考察をおこなうものである。
|