• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

書き言葉コーパスに基づくテキスト分類尺度の探索的研究

Research Project

Project/Area Number 21520493
Research Institution大学共同利用機関法人人間文化研究機構国立国語研究所

Principal Investigator

小磯 花絵  大学共同利用機関法人人間文化研究機構国立国語研究所, 理論構造研究系, 准教授 (30312200)

Co-Investigator(Kenkyū-buntansha) 田中 弥生  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト特別研究員 (90462811)
小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
Keywords書き言葉コーパス / テキスト分類 / 分類尺度 / ジャンル
Research Abstract

書き言葉を多角的に分類するための基本的な尺度を,コーパスに基づく探索的研究を通して構築することを目標に,21年度は次の3つを実施した.
(1)評定実験の実施:
A)評定語の選出:先行研究を参考に文体や文章分類に関する指標・評定語を抽出し,整理した.
B)予備調査:2回の予備実験を通して,本実験で利用する評定語対を選別し,評定対象とするテキストの種類や分量を決定した.また予備調査を踏まえ,評定作業者用のマニュアルを作成した.
C)本調査の実施:8月上旬から10月にかけて本調査を実施した.『現代日本語書き言葉均衡コーパス』より,テーマを社会に限定して300のサンプル(各サンプル500文字)を抽出し,それを対象に評定者3名により8つの評定語対(例:改まった・くだけた,客観的・主観的)にもとづき評定を実施した.
(2)研究用情報付与:評定実験に用いた300の文章サンプルを対象に,分析に用いる情報として,文境界情報,品詞情報,語種情報を付与した.
(3)評定結果の分析:評定実験の結果を対象に,評定語間の相関関係や評定者間の一致度などについて検討し,調査の妥当性や問題点などについて検討した.また,品詞・語種・文特徴(文末文体など)と各評定語との関係についても予備的に調査した.
従来の文章分類の研究は,体系化自体が自己目的化することが少なくなかったが,本研究では,実際に人手で評定値を付与したデータを作成し,それに基づき基本的尺度を求める手法をとる点に特徴があるといえる.

  • Research Products

    (9 results)

All 2010 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (8 results)

  • [Journal Article] 質問サイトにおける情報要求モデルと待遇コミュニケーション-「アットコスメ美容事典」の談話機能・談話構造の分析から2010

    • Author(s)
      田中弥生
    • Journal Title

      待遇コミュニケーション 17

      Pages: 33-48

    • Peer Reviewed
  • [Presentation] 長単位情報に基づくジャンル間の文体に関する分析2010

    • Author(s)
      小磯花絵・小木曽智信・小椋秀樹・宮内佐夜香
    • Organizer
      特定領域研究「日本語コーパス」平成21年度公開ワークショツプ
    • Place of Presentation
      東京工業大学
    • Year and Date
      2010-03-16
  • [Presentation] Q&Aコミュニティの談話機能と構造-「Yahoo!知恵袋」を対象に-2010

    • Author(s)
      田中弥生
    • Organizer
      特定領域研究「日本語コーパス」 平成21年度公開ワークショップ(研究成果報告会)
    • Place of Presentation
      東京工業大学
    • Year and Date
      2010-03-15
  • [Presentation] 特定領域研究「日本語コーパス」平成21年度公開ワークショップ2010

    • Author(s)
      小木曽智信
    • Organizer
      社会言語科学会第25回研究大会
    • Place of Presentation
      慶応義塾大学
    • Year and Date
      2010-03-13
  • [Presentation] 修辞ユニットを用いた書き言葉の分析-「書き言葉・話し言葉」と(脱)文脈化の関係-2010

    • Author(s)
      佐野大樹・小磯花絵
    • Organizer
      社会言語科学会第25回研究大会
    • Place of Presentation
      慶応義塾大学
    • Year and Date
      2010-03-13
  • [Presentation] Q&Aサイトの「質問-回答」における結束性~省略の特徴分析~2010

    • Author(s)
      田中弥生
    • Organizer
      電子情報通信学会 言語理解とコミュニケーション研究会 第1回集合知シンポジウム~言語処理が紡ぎ出す未来~
    • Place of Presentation
      広島市まちづくり市民交流プラザ
    • Year and Date
      2010-01-25
  • [Presentation] アットコスメの待遇意識表現2009

    • Author(s)
      田中弥生
    • Organizer
      「言語と人間」研究会11月例会
    • Place of Presentation
      立教大学
    • Year and Date
      2009-11-09
  • [Presentation] 『現代日本語書き言葉均衡コーパス』における可能表現のバリエーション2009

    • Author(s)
      小木曽智信
    • Organizer
      日本語学会2009年度秋季大会
    • Place of Presentation
      島根大学
    • Year and Date
      2009-11-01
  • [Presentation] 『現代日本語書き言葉均衡コーパス』に現れる接続表現形式のジャンル別比較2009

    • Author(s)
      宮内佐夜香・小木曽智信・小椋秀樹・小磯花絵
    • Organizer
      日本語学会2009年度春季大会
    • Place of Presentation
      武庫川女子大学
    • Year and Date
      2009-05-31

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi