• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

書き言葉コーパスに基づくテキスト分類尺度の探索的研究

研究課題

研究課題/領域番号 21520493
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小磯 花絵  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論構造研究系, 准教授 (30312200)

研究分担者 田中 弥生  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト特別研究員 (90462811)
小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
キーワード書き言葉コーパス / テキスト分類 / 分類尺度 / ジャンル
研究概要

本年度は人がテキストを読んだ際に感じる印象を表わす表現を調査し,実際のテキストに対して評定実験を行った上で,分類指標を探索的に体系化することを試みた。具体的には次の4つを実施した。
1.評定語の収集と評定語対の作成:一般の人がテキストを描写・評価する際に用いる様々な表現を収集することを目的に,調査者7名に40のテキスト(新聞,小説以外の書籍,雑誌,行政白書,Yahoo!ブログより選択,各サンプル約300文字)を読んでもらい,それぞれのテキストから受ける印象を記述してもらうという調査を実施した。この調査によって収集した評価語から,20の評定語対(「改まった-くだけた」「整然とした-雑然とした」など)を作成した。
2.評定実験:安定した尺度を構成するため,3名の被験者を対象に,1で得られた20の評定語対をもとに,テキストに対する印象についてSD法による5段階評定実験を実施した。テキストサンプルは1で用いた40サンプルを利用した。
3.基本評定尺度の抽出:2で得られた評定結果を対象に,因子分析を行った。因子負荷量がいずれも小さい値しか示さない評定尺度や複数の因子にまたがって高い因子負荷量を持つ評定尺度は削除した。これを繰り返した結果,最終的に12の評定尺度が残り,「スタイル」「文構成の明晰性」「抑揚・リズム性」という3つの因子が抽出された。
4.テキストの試験的分類:3で抽出した3つの因子を用いて暫定的にテキストを分類し,各次元にどのような特徴を有するテキストが分類されるかを調査した。

  • 研究成果

    (12件)

すべて 2011 2010

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (11件)

  • [雑誌論文] 「質問-回答」における待遇表現の特徴-書籍QA、WebQA、Yahoo!知恵袋の比較から-2011

    • 著者名/発表者名
      田中弥生
    • 雑誌名

      待遇コミュニケーション研究

      巻: 8 ページ: 65-80

    • 査読あり
  • [学会発表] Yahoo!知恵袋における質問と回答の分類-修辞ユニット分析を用いた脱文脈化-文脈化の程度による検討-2011

    • 著者名/発表者名
      田中弥生・佐野大樹
    • 学会等名
      社会言語科学会第27回研究大会
    • 発表場所
      桜美林大学
    • 年月日
      2011-03-19
  • [学会発表] テキストの多様性をとらえる分類指標の構築を目指して2011

    • 著者名/発表者名
      小磯花絵、田中弥生、小木曽智信、近藤明日子
    • 学会等名
      文部科学省科学研究費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」平成22年度公開ワークショップ
    • 発表場所
      時事通信ホール
    • 年月日
      2011-03-16
  • [学会発表] Yahoo!知恵袋の質問における修辞機能の分布-修辞ユニット分析を用いて-2011

    • 著者名/発表者名
      田中弥生・佐野大樹
    • 学会等名
      文部科学省科学研究費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」平成22年度公開ワークショップ
    • 発表場所
      時事通信ホール
    • 年月日
      2011-03-15
  • [学会発表] 長単位に基づく媒体・カテゴリ間の品詞比率に関する分析2011

    • 著者名/発表者名
      冨士池優美、小西光、小椋秀樹、小木曽智信、小磯花絵
    • 学会等名
      文部科学省科学研究費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」平成22年度公開ワークショップ
    • 発表場所
      時事通信ホール
    • 年月日
      2011-03-15
  • [学会発表] テキストの多様性をとらえる分類指標の体系化の試み2011

    • 著者名/発表者名
      小磯花絵・田中弥生・小木曽智信・近藤明日子
    • 学会等名
      言語処理学会第17回年次大会(NLP2011)
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-09
  • [学会発表] 長単位に基づく『現代日本語書き言葉均衡コーパス』の品詞比率に関する分析2011

    • 著者名/発表者名
      冨士池優美, 小西光, 小椋秀樹, 小木曽智信, 小磯花絵
    • 学会等名
      言語処理学会第17回年次大会(NLP2011)
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-09
  • [学会発表] 修辞ユニット分析からみたQ&Aサイトの言語的特徴2011

    • 著者名/発表者名
      田中弥生・佐野大樹
    • 学会等名
      言語処理学会第17回年次大会(NLP2011)
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-08
  • [学会発表] Yahoo!ブログにおける待遇表現-投稿に使用した機器による比較2010

    • 著者名/発表者名
      田中弥生
    • 学会等名
      待遇コミュニケーション学会2010年秋季大会
    • 発表場所
      早稲田大学
    • 年月日
      2010-10-30
  • [学会発表] 社会科学と文学の「あとがき」における文体的特徴の相違2010

    • 著者名/発表者名
      田中弥生
    • 学会等名
      計量国語学会 第五十四回大会
    • 発表場所
      大正大学
    • 年月日
      2010-09-11
  • [学会発表] 異なる媒体における「QA」の文体的特徴-書籍とWebを比較して-2010

    • 著者名/発表者名
      田中弥生
    • 学会等名
      社会言語科学会第26回研究大会
    • 発表場所
      大阪大学
    • 年月日
      2010-09-04
  • [学会発表] Yahoo!ブログの文体的特徴-投稿に使用した機器による比較-2010

    • 著者名/発表者名
      田中弥生
    • 学会等名
      文部科学省科学研究費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」平成22年度全体会議
    • 発表場所
      国立国語研究所
    • 年月日
      2010-08-31

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi