2010 Fiscal Year Annual Research Report
書き言葉コーパスに基づくテキスト分類尺度の探索的研究
Project/Area Number |
21520493
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
小磯 花絵 大学共同利用機関法人人間文化研究機構国立国語研究所, 理論構造研究系, 准教授 (30312200)
|
Co-Investigator(Kenkyū-buntansha) |
田中 弥生 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト特別研究員 (90462811)
小木曽 智信 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
|
Keywords | 書き言葉コーパス / テキスト分類 / 分類尺度 / ジャンル |
Research Abstract |
本年度は人がテキストを読んだ際に感じる印象を表わす表現を調査し,実際のテキストに対して評定実験を行った上で,分類指標を探索的に体系化することを試みた。具体的には次の4つを実施した。 1.評定語の収集と評定語対の作成:一般の人がテキストを描写・評価する際に用いる様々な表現を収集することを目的に,調査者7名に40のテキスト(新聞,小説以外の書籍,雑誌,行政白書,Yahoo!ブログより選択,各サンプル約300文字)を読んでもらい,それぞれのテキストから受ける印象を記述してもらうという調査を実施した。この調査によって収集した評価語から,20の評定語対(「改まった-くだけた」「整然とした-雑然とした」など)を作成した。 2.評定実験:安定した尺度を構成するため,3名の被験者を対象に,1で得られた20の評定語対をもとに,テキストに対する印象についてSD法による5段階評定実験を実施した。テキストサンプルは1で用いた40サンプルを利用した。 3.基本評定尺度の抽出:2で得られた評定結果を対象に,因子分析を行った。因子負荷量がいずれも小さい値しか示さない評定尺度や複数の因子にまたがって高い因子負荷量を持つ評定尺度は削除した。これを繰り返した結果,最終的に12の評定尺度が残り,「スタイル」「文構成の明晰性」「抑揚・リズム性」という3つの因子が抽出された。 4.テキストの試験的分類:3で抽出した3つの因子を用いて暫定的にテキストを分類し,各次元にどのような特徴を有するテキストが分類されるかを調査した。
|
Research Products
(12 results)