2007 Fiscal Year Annual Research Report
大規模テキストデータベースを用いたフィンランド語の形態・統語情報のサンプル化
Project/Area Number |
19720100
|
Research Institution | Reitaku University |
Principal Investigator |
千葉 庄寿 Reitaku University, 外国語学部, 准教授 (70337723)
|
Keywords | 外国語(中・英・仏・独除く) / 言語学 / フィンランド語 / コーパス言語学 / 形態論 / 統語論 |
Research Abstract |
研究初年度にあたる今年度は,機材やソフトウエアの購入等,環境整備を重点的におこなうとともに,本研究の方法論に関する予備的考察,および本研究で利用するコーパスの調査をおこなった。具体的な活動内容は以下のとおりである。 1.コーパスの量的分析の基準となるパラメータを選定した。 2.フィンランド学術計算機センターのテキストコーパス「フィンランド語バンク」に収録されているコーパス群について,データ構造の調査と基礎的な統計分析をおこない,各コーパスの特徴の記述と分類をおこなった。 3.用例サンプル抽出の方法の技術的な問題点を整理し,用例サンプル抽出のためのプログラム開発の準備をおこなった。 4.コーパスデータに形態・統語解析を施して格納するためのデータベースの構築準備をおこなった。 5.フィンランド語文法およびコーパス言語学・言語統計処理に関する基礎資料を収集した。 フィンランド語の量的研究およびコーパスを利用したフィンランド語の文法研究に関する先行研究の評価に関する研究発表をおこなうと共に論文を執筆した。また,形態統語的情報と語彙の共起関係を量的に評価するため,コロケーションの量的分析の手法を拡張する枠組みの提案を複数の学会・研究会にておこなった。 なお,今年度予定していた海外調査は交流予定の研究者の都合により次年度以降に実施することとなった。また,大規模データの格納に必要なストレージ機器の導入が遅れたため,サンプル化プログラムの評価とプログラムを用いたデータの蓄積と分析は次年度開始の予定である。
|