• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

言語研究資料としてのコーパスデータの客観性と信頼性に関する考察

Research Project

Project/Area Number 22520494
Research InstitutionNagoya University

Principal Investigator

大名 力  名古屋大学, 国際開発研究科, 准教授 (00233205)

Keywords言語学 / コーパス / 文法 / 語法
Research Abstract

プロジェクトの2年目である23年度は,「統計値の意味とその扱い」・「表現のバリエーションと対象の選択」の問題を中心に検討を行った。具体的には,コーパス(データ)の代表性,コーパス内・サブコーパス間での偏り,対象の選択・提示方法(分類のパラドックス),統計値の解釈と検定,"コロケーション"・"連想関係"の多義性,連想関係に関する計量的指標(主としてt-scoreとMI-score)の信頼性と妥当性について考察を行い,その成果の一部を「MI-score, t-scoreと"コロケーション"」という題目で英語コーパス学会第37回大会において発表した。
どの範囲の表現を対象とするかによって,出現頻度などの基礎的なデータも変わってしまうため,定量的分析においては,表現のバリエーションに配慮することは重要なことであるが,従来の語法文法研究で行われている分析に比べ,表現の変種への配慮が不十分と思われるケースが少なくないため,具体例を取り上げ,問題点の整理を行った。コーパスデータを処理する際,便宜的に言語学的分類の代わりに表記上の形式的分類を用いることがあるが,そのような処理方法に問題はないのか,さらに,コーパスの構造と言語変種の分離(付帯情報・タグ・コーディング,異質な言語変種の混在,メタな言語使用)の問題等についても検討を行った。
これらの成果の一部に関しては,24年度に公開予定(既に一部印刷中)である。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

特に大きな問題もなく,おおむね計画通り進んでいるため。

Strategy for Future Research Activity

基本的には計画通り進んでいるが,扱う事項は相互に関係したものであるため,最終年度の今年度は,これまでの成果を踏まえ研究を進めるだけでなく,逆に,これからの研究の内容を踏まえ,これまでの研究内容の再検討を行う。

  • Research Products

    (2 results)

All 2011

All Presentation (1 results) Book (1 results)

  • [Presentation] MI-score,t-scoreと"コロケーション"2011

    • Author(s)
      大名力
    • Organizer
      英語コーパス学会第37回大会
    • Place of Presentation
      京都外国語大学(京都府)
    • Year and Date
      2011-10-01
  • [Book] 『言語研究の技法-データの収集と分析』大名力「言語研究のためのテキスト処理の基礎知識」(pp.259-278)大名力「表計算ソフト、正規表現によるテキスト処理」(pp.279-300)2011

    • Author(s)
      藤村逸子・滝沢直宏編
    • Total Pages
      337ページ(うちpp.259-278,pp.279-300担当)
    • Publisher
      ひつじ書房

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi