• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実績報告書

言語研究資料としてのコーパスデータの客観性と信頼性に関する考察

研究課題

研究課題/領域番号 22520494
研究機関名古屋大学

研究代表者

大名 力  名古屋大学, 国際開発研究科, 准教授 (00233205)

キーワード言語学 / コーパス / 文法 / 語法
研究概要

プロジェクトの2年目である23年度は,「統計値の意味とその扱い」・「表現のバリエーションと対象の選択」の問題を中心に検討を行った。具体的には,コーパス(データ)の代表性,コーパス内・サブコーパス間での偏り,対象の選択・提示方法(分類のパラドックス),統計値の解釈と検定,"コロケーション"・"連想関係"の多義性,連想関係に関する計量的指標(主としてt-scoreとMI-score)の信頼性と妥当性について考察を行い,その成果の一部を「MI-score, t-scoreと"コロケーション"」という題目で英語コーパス学会第37回大会において発表した。
どの範囲の表現を対象とするかによって,出現頻度などの基礎的なデータも変わってしまうため,定量的分析においては,表現のバリエーションに配慮することは重要なことであるが,従来の語法文法研究で行われている分析に比べ,表現の変種への配慮が不十分と思われるケースが少なくないため,具体例を取り上げ,問題点の整理を行った。コーパスデータを処理する際,便宜的に言語学的分類の代わりに表記上の形式的分類を用いることがあるが,そのような処理方法に問題はないのか,さらに,コーパスの構造と言語変種の分離(付帯情報・タグ・コーディング,異質な言語変種の混在,メタな言語使用)の問題等についても検討を行った。
これらの成果の一部に関しては,24年度に公開予定(既に一部印刷中)である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

特に大きな問題もなく,おおむね計画通り進んでいるため。

今後の研究の推進方策

基本的には計画通り進んでいるが,扱う事項は相互に関係したものであるため,最終年度の今年度は,これまでの成果を踏まえ研究を進めるだけでなく,逆に,これからの研究の内容を踏まえ,これまでの研究内容の再検討を行う。

  • 研究成果

    (2件)

すべて 2011

すべて 学会発表 (1件) 図書 (1件)

  • [学会発表] MI-score,t-scoreと"コロケーション"2011

    • 著者名/発表者名
      大名力
    • 学会等名
      英語コーパス学会第37回大会
    • 発表場所
      京都外国語大学(京都府)
    • 年月日
      2011-10-01
  • [図書] 『言語研究の技法-データの収集と分析』大名力「言語研究のためのテキスト処理の基礎知識」(pp.259-278)大名力「表計算ソフト、正規表現によるテキスト処理」(pp.279-300)2011

    • 著者名/発表者名
      藤村逸子・滝沢直宏編
    • 総ページ数
      337ページ(うちpp.259-278,pp.279-300担当)
    • 出版者
      ひつじ書房

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi