研究課題/領域番号 |
23520471
|
研究機関 | 麗澤大学 |
研究代表者 |
千葉 庄寿 麗澤大学, 外国語学部, 教授 (70337723)
|
キーワード | フィンランド語 / その他の外国語 / コーパス / 派生 / 統語論 / 国際情報交流 / フィンランド |
研究概要 |
本研究は平成19年度~22年度若手研究(B)「大規模テキストデータベースを用いたフィンランド語の形態統語情報のサンプル化」により構築したデータベースを利用し,形態論的派生を伴う構文の構文特徴を,コーパス全体の量的情報との比較により抽出・記述する試みである。 本年度は,以下の3点を中心に研究活動をすすめた。(1) 語彙情報のプロファイリングをおこなう調査対象の構文の検討をおこなった。(2) 各構文の用例の抽出・収集作業をおこない語彙・文法情報のデータベース化のための準備をおこなった。(3) 前述のデータベースから抽出した量的情報を構文特徴の評価に用いるための語彙情報プロファイリングの手法の検討をおこなった。 上記 (3) は特定の構文を特徴づける語彙・文法要素の出現傾向を用例データから取得し,コーパス全体が示す量的傾向との差異を検証するものである。本年度は語彙情報プロファイリングの基本的な考え方を検証するため,検証内容を2形態素の単純連鎖および統語的依存関係をもつ2形態素の組み合わせに限定して分析を試みた。その結果,統語的環境に関する量的な情報が構文特徴の評価にある程度効果があることが観察できた。 また,年度末に海外出張をおこない,本研究が使用するフィンランド語コーパスがもつ偏りの問題を検討するとともに,他ジャンルのコーパスの構築の実績をもつフィンランドの研究者と情報交換をおこなった。 語彙情報プロファイリングの分析の枠組みの有効性を検証するため,日本語コーパスへの応用を引き続き試みた。具体的には現代日本語書きことば均衡コーパス(BCCWJ)と名大会話コーパス(雑談データ)の語彙情報の比較をおこなったほか,フィンランド語,日本語,英語といった類型論的特徴の異なる言語コーパスに共通する分析の枠組みの構築にむけた検討をおこなった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
今年度は本研究の前半の最も大きな目標であるプロファイリング情報の指標化に関する検討を中心にすすめたが,この作業は未だ十分な成果をあげるに至っていない状況である。これは調査対象とする構文の選定と具体的な用例データベースの整備が遅れており,これらを手法の検討と平行して行う必要があるためである。そこで,本年度後半は分析対象となる派生要素のリストアップと用例の整理に重点を置き作業をすすめた。 また,本研究が分析対象としているフィンランド語の大規模コーパス (「言語バンク」) のデータが書きことばの特定のジャンル(新聞データ)に偏っていることに起因して,分析対象となる構文の語彙パターンを異なるジャンルのコーパスで多角的に検証することが現在のデータでは難しいことが分かった。そこで,データの検証方法および他ジャンルのフィンランドコーパスの利用の可能性について,海外の研究者と意見を交換し,対策の検討を開始した。
|
今後の研究の推進方策 |
24年度から本年度にかけておこなった語彙情報プロファイリングの予備的分析および2連鎖の形態素の情報に基づく基礎分析の結果について研究発表をおこなう。また,構文特徴として有効な語彙パターンの抽出をしやすくする語彙情報プロファイリングの分析ツールの開発を引き続きすすめ,分析手法の開発をおこなう。 研究対象とする派生要素を含む構文のリストアップと用例のデータベース化は平成25年度中の完了をめざし,残る研究期間において構文の生産性に関する分析を本格的に実施する。 また,本研究が提案する語彙情報プロファイリングの手法の検証にあたっては,より広いジャンルのコーパスデータの利用も視野に入れ,検討を引き続きおこなう。
|
次年度の研究費の使用計画 |
フィンランド語の形態統語分析ソフトウェアの更新をおこなうとともに,研究成果の発表と研究打ち合わせを兼ねて海外出張 (ないし研究者の招聘) をおこなう。また,論文校閲と用例データのネイティブチェックのための費用を計上する。 なお,現在のデータベースの構築状況と分析作業の進捗状況をふまえ,現在のところ研究成果公開用のレンタルサーバの調達は平成26年度の開始を予定している。
|