本研究は平成19年度~22年度若手研究(B)「大規模テキストデータベースを用いたフィンランド語の形態統語情報のサンプル化」により構築したデータベースを利用し,形態論的派生を伴う構文の特徴を,コーパス全体の量的情報との比較により抽出・記述する試みである。 本年度は昨年度までの研究を総括するための研究活動に取り組んだ。(1)語彙情報プロファイリングをおこなう派生を伴う構文データベースの基本部分について,構築を完了した。(2)構文データベースの分析をすすめた。特に,既に専門家に指摘されてきた,指標による構文の生産生評価の問題を解決すべく,可視化の手法を適用するための分析環境の整備をおこない一定の見通しを得ることができた。(3)これまで得られた研究成果に関して,国際学会で研究発表をおこない専門家からのフィードバックを受けた。 今年度はさらに,研究活動を補完する作業として(a)研究者から指摘があった,動詞以外の品詞を語根とする派生語の生産性の統計的な評価と比較のための追加のデータ収集とデータベースの拡張,(b)新たに公開されているフィンランド語の大規模電子フォーラム(Suomi 24)のデータ処理,および(c)新たに利用可能となった会話コーパスのデータ取得とデータ処理の試行をおこなった。(a)の結果,本研究でおこなっている名詞由来の派生語との比較に必要なデータが得られた。今後フィンランド語の派生語の生産性に関する総合的な分析をおこなう予定である。(b)は基本的な解析作業を完了した。このコーパスから得られるについては,引き続き本研究で構築している構文データベースとの比較をおこなっていく予定である。(c)会話コーパスのデータの処理に関しては,転写データの解析に必要な整合性のチェックをおこなった。会話コーパスのサンプル選択を含め今後さらに研究者と打ち合わせをすすめていきたい。
|