2014 Fiscal Year Research-status Report
語彙情報プロファイリングに基づくフィンランド語の派生要素を含む構文の生産性評価
Project/Area Number |
23520471
|
Research Institution | Reitaku University |
Principal Investigator |
千葉 庄寿 麗澤大学, 外国語学部, 教授 (70337723)
|
Project Period (FY) |
2011-04-28 – 2016-03-31
|
Keywords | フィンランド語 / その他の外国語 / コーパス / 形態論 / 統語論 / 形態論的派生 / 生産性 / 国際情報交流 |
Outline of Annual Research Achievements |
本研究は平成19年度~22年度若手研究(B)「大規模テキストデータベースを用いたフィンランド語の形態統語情報のサンプル化」により構築したデータベースを利用し,形態論的派生を伴う構文の特徴を,コーパス全体の量的情報との比較により抽出・記述する試みである。 本年度は,以下の2点を中心に研究活動を進めた。(1)語彙情報プロファイリングをおこなう派生を伴う構文データベースの完成をめざしてデータの整備をおこなった。(2)構文データベースの分析をすすめた。後者については,特に複数の形態統語情報の処理について,可視化 (visualization) をふくめた情報収集と分析方法の検討をおこなった。 初期の研究計画にない新たな方針として,研究データの拡張とその応用可能性を検討するため,7月にコロケーションおよびフィンランド語学習者コーパスの専門家をフィンランド共和国より招聘して研究会を開催するとともに学会発表をおこなった。同時に,研究打ち合わせと研究情報の交換をおこない,コロケーション分析に関する有益なコメントを得るとともに,本研究のデータおよび研究手法を応用言語学の分野に応用するための見通しを得ることができた。 さらに,今年度新たに公開された大規模なフィンランド語の電子フォーラム(Suomi 24)コーパスについて,比較データとしての利用を想定した解析を開始した。当該データは口語により近い書き言葉であり,派生語の利用状況を比較することで,文語に偏った現在のデータベースの弱点を補完することが期待される。また,現代フィンランド語の書き言葉データの全体像の描出にも役立てることができると考えられる。なお,昨年度からの継続課題として,口語データ(談話資料),学習者コーパスを含む異なるジャンルのコーパスをもちいた多角的な比較分析の可能性についても,引き続き専門家と研究打ち合わせをおこない検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本研究は「語彙情報プロファイリング」の分析手法の確立を目指すものであるが,その手法の確立には当初から時間がかかることが想定されていた。昨年度までの研究においては,サンプル化された形態統語情報のプロファイリングの方法として,プロファイリング情報を統計的に指標化することを想定し,その手法の検討をおこなってきた。しかし,その後複数の専門家やソフトウェア開発者との議論の結果,それだけではデータベースから得られる多種多様な形態統語情報を総合的に評価・分析することが困難であるという見通しが得られた。そこで,新たなデータ分析手法として,統計的指標の利用に加え可視化(visualization)の手法を用いることを検討し,今年度からいくつかのアプリケーションおよびツールによる実験を開始することとなった。そのため,分析手法の確立には当初想定していない大幅な遅延が発生することとなっている。 また,構文データベースの構築に時間がかかっていることも研究の進捗に大きく影響している。現在既に選定済みの派生要素を含む構文の用例情報については今年度中のデータベース化の目処がたっているが,動詞派生の派生語だけでなく,名詞を語根とする名詞派生の派生語についても追加で調査することが必要となっており,そのためのデータベースの拡張とデータの整備が必要となっている。
|
Strategy for Future Research Activity |
今後,最終年度での成果とりまとめにむけて,データベースの構造や分析の過程,分析結果を報告書にまとめるとともに,研究成果の公開にむけた活動をおこなう。最終年度前半までは分析結果を国際学会およびフィンランド共和国の専門学会で研究発表の形で公表することに注力する。フィンランド語の専門家やコーパス言語学,統計学,機能言語学の研究者らと意見を交換したのち,論文として成果を公刊する予定である。 可視化 (visualization) は本研究課題の主要なトピックとして当初想定していなかったが,今年度の研究活動において,その効果や応用可能性が非常に大きいことが分かった。今後も引き続き,可視化の本研究への応用可能性に関する検討をすすめ,可視化に基づく実験的分析の結果についても,報告書に含めることを検討している。
|
Causes of Carryover |
研究者との研究打ち合わせおよび研究情報の交換において,分析対象として動詞以外の品詞を語根とする派生語についても構文データベースに含め,その生産性を同様に評価し名詞派生の派生語と比較対照する必要があるとのコメントがあり,追加のデータ収集とデータベースの拡張をおこなうこととなった。これに付随するデータの追加と分析,分析結果のネイティブチェックに時間を要する状況となっている。 また,今年度から新たに利用が可能となった,より口語に近いフィンランド語コーパスのデータ処理と比較データとしての利用にも,年度を越えて作業を継続する必要が生じている。
|
Expenditure Plan for Carryover Budget |
次年度は研究のとりまとめと公開とともに,最終的な報告書の作成が助成金の主たる使用目的となる。フィンランド共和国内外の国際学会における研究発表および研究打ち合わせ旅費のほか,研究データのネイティブチェック,および論文・最終報告書の作成および校正のための謝金としての使用を計画している。
|
Remarks |
データベースの構築に遅れが生じていること,また研究手法の開発にも遅延が生じていることから,今年度および来年度前半までの研究成果の公開は研究発表によるものが中心となっている。
|