• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

大規模テキストデータベースを用いたフィンランド語の形態・統語情報のサンプル化

Research Project

Project/Area Number 19720100
Research InstitutionReitaku University

Principal Investigator

千葉 庄寿  Reitaku University, 外国語学部, 准教授 (70337723)

Keywords外国語(中・英・仏・独除く) / 言語学 / フィンランド語 / コーパス言語学 / 形態論 / 統語論
Research Abstract

前年度実施したフィンランド学術計算機センターのテキストコーパス「フィンランド語バンク」に収録されているコーパス群の基礎調査に基づき, サンプルデータベースの構築と分析手法の整備をおこなった。具体的な活動内容は以下のとおりである。
1. 平成19年度に引き続き, コーパスデータに形態・統語解析を施して格納するためのデータベースの設計と構築をおこなうとともに, プロトタイプのデータベースから形態・統語パラメータによる統計情報を抽出するプログラムのセットを開発した。
2. 平成19年度に実施した「フィンランド語バンク」の基礎的な分析に基づき, コーパスが属する使用域毎にサンプル化をおこなった。
3. サンプル化で抽出したコーパスのサブセットにfi-fdgを用いて形態・統語情報を付与した。各サンプルについて, 予備的に形態・統語解析情報の統計分析をおこなった。
4. 自動解析された形態・統語情報の検証と校正作業を開始した。この作業は引き続き次年度も実施する。
5. プロトタイプのデータベースの構造と文法情報のパラメータについて, フィンランド内国語研究所およびフィンランド学術計算機センターの専門家との研究打ち合わせをおこなった。
6. XMLおよびデータベースの処理に関する資料を収集し, またコーパス言語靴関する研究会'シンポジウムに参加し情報交換をおこなった。
形態・統語情報の分析と量的な評価の方法に関する研究発表をおこない, 論文を執筆した。今年度はデータベースの構築作業が計画どおり進まず, データベースの本格的な分析は次年度以降に回さざるをえなかった。大規模データの格納に導入したストレージ幾器がデータベース構築環境に適しておらず, 現段階ではデータベースはワークステーションのハードディスク上に直接構築している。また, 現段階で, 統語解析ツールとの連携に問題が発生しており, 次年度以降はデータベースと統語解析ツールを共通のLinuxサーバ上で運用する予定である.

  • Research Products

    (7 results)

All 2009 2008

All Journal Article (4 results) Presentation (3 results)

  • [Journal Article] 大規模コーパスの語彙統計情報の利用を支援する一語彙情報データベースを参照するAPIの構築と活用-2009

    • Author(s)
      千葉庄寿
    • Journal Title

      特定領域研究「日本語コーパス」平成20年度公開ワークショップ予稿集

      Pages: 103-108

  • [Journal Article] コリゲーションと形態統語情報-類型論的観点から-2009

    • Author(s)
      千葉庄寿
    • Journal Title

      文部科学省科学研究費補助金基盤研究(A)「ロシアおよびその周辺の少数言語のコーパスの構築と記述的・歴史的研究」研究成果報告書

      Pages: 37-54

  • [Journal Article] アノテートされた大規模コーパスを用いた分析ツールの現状と今後の方向性2009

    • Author(s)
      千葉庄寿
    • Journal Title

      文部科学省科学研究費補助金基盤研究(A)「ロシアおよびその周辺の少数言語のコーパスの構築と記述的・歴史的研究」研究成果報告書

      Pages: 55-70

  • [Journal Article] 日本語コーパスからのコロケーション情報の抽出 : 言語特徴を考慮した枠組みに基づくシステムの設計2008

    • Author(s)
      千葉庄寿
    • Journal Title

      日本語教育学世界大会(第7回日本語教育国際研究大会)予稿集 2

      Pages: 51-53

  • [Presentation] 大規模コーパスの語彙統計情報の利用を支援する-語彙情報データベースを参照するAPIの構築と活用-2009

    • Author(s)
      千葉庄寿
    • Organizer
      特定領域研究「日本語コーパス」平成20年度公開ワークショップ
    • Place of Presentation
      東京工業大学
    • Year and Date
      2009-03-15
  • [Presentation] 話し言葉のコーパスとデータ処理2009

    • Author(s)
      千葉庄寿
    • Organizer
      基盤研究(B)「人間の相互作用研究のための多言語会話コーパスの構築とその語用論的分析方法の開発」(課題番号20320072 ; 研究代表者 : 宇佐美まゆみ)による講演
    • Place of Presentation
      東京外国語大学
    • Year and Date
      2009-02-06
  • [Presentation] 日本語コーパスからのコロケーション晴報の抽出 : 言語特徴を考慮した枠組みに基づくシステムの設計2008

    • Author(s)
      千葉庄寿
    • Organizer
      日本語教育学世界大会(第7回日本語教育国際研究大会)
    • Place of Presentation
      釜山外国語大学校(韓国)
    • Year and Date
      2008-07-12

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi