• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1997 年度 実績報告書

台本の語彙分析にもとづく会話文の特徴の抽出

研究課題

研究課題/領域番号 09204243
研究機関国立教育研究所

研究代表者

吉岡 亮衛  国立教育研究所, 教育情報・資料センター, 室長 (40200951)

キーワード台本 / 語彙 / データベース / コンピュータ / 統計 / 分析 / 計量 / 会話文
研究概要

本研究の目的は、話し言葉の典型として台本データを材料とし、話し言葉を特徴付ける情報は何かについて、統計的手法を駆使して抽出し、加えて書き言葉の特徴と比較考察することである。
一昨年度は「新書の語彙分析による特徴の抽出」という課題で、文科系的な読み物として講談社現代新書の特徴を単語分析から抽出することを試みた。また、昨年度は「科学読み物の語彙分析にもとづく特徴の抽出」という課題で、理科系の読み物として講談社のブルーバックスを材料として、特徴の抽出を試みた。両者とも書き言葉の文章についての語彙分析であった。そこで本年は、それらとは対照的な話し言葉の文章を分析し、書き言葉の特徴と話し言葉の特徴を対比させることを目指した。材料として選んだものは、松竹映画の「男はつらいよ」シリーズの台本である。以下の手順で研究を行った。単年度の研究計画として計画しているが、昨年度のまでの研究成果を踏まえて研究を行っている。
具体的には、次の研究を行った。
(1)台本テキスト中の単語の切り出し
48作品中、41作品は既に磁気データ化しているので、本研究では残り7作品の磁気データ化を行い、全作品の文章を分析対象とできるように整備した。
(2)単語に対する品詞付け
(1)、(2)に作業は、ワークステーション上で日本語形態素解析システム茶筌(ChaSen)1.0を用いて行った。
(3)統計分析(汎用コンピュータ上のパッケージANALYSTを使用した。分析項目として次の項目を分析した。
〇文について
文長、1文中の単語数
〇単語について
単語長、頻度表(総単語、品詞別)、品詞の使用割合
(4)分析結果のまとめ
分析結果は、グラフ・図表にまとめ、視覚的に特徴をとらえることができるようにした。この結果については、本重点領域研究の報告書に提出するとともにホームページ上で一般に公開した。

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 吉岡亮衛: "台本の語彙分析にもとづく会話文の特徴の抽出" 重点領域研究「人文科学とコンピュータ」報告書. 1. (1998)

URL: 

公開日: 1999-03-15   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi