Project/Area Number |
09204243
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | National Institute for Educational Policy Research |
Principal Investigator |
吉岡 亮衛 国立教育研究所, 教育情報・資料センター, 室長 (40200951)
|
Project Period (FY) |
1997
|
Project Status |
Completed (Fiscal Year 1997)
|
Budget Amount *help |
¥1,500,000 (Direct Cost: ¥1,500,000)
Fiscal Year 1997: ¥1,500,000 (Direct Cost: ¥1,500,000)
|
Keywords | 台本 / 語彙 / データベース / コンピュータ / 統計 / 分析 / 計量 / 会話文 |
Research Abstract |
本研究の目的は、話し言葉の典型として台本データを材料とし、話し言葉を特徴付ける情報は何かについて、統計的手法を駆使して抽出し、加えて書き言葉の特徴と比較考察することである。 一昨年度は「新書の語彙分析による特徴の抽出」という課題で、文科系的な読み物として講談社現代新書の特徴を単語分析から抽出することを試みた。また、昨年度は「科学読み物の語彙分析にもとづく特徴の抽出」という課題で、理科系の読み物として講談社のブルーバックスを材料として、特徴の抽出を試みた。両者とも書き言葉の文章についての語彙分析であった。そこで本年は、それらとは対照的な話し言葉の文章を分析し、書き言葉の特徴と話し言葉の特徴を対比させることを目指した。材料として選んだものは、松竹映画の「男はつらいよ」シリーズの台本である。以下の手順で研究を行った。単年度の研究計画として計画しているが、昨年度のまでの研究成果を踏まえて研究を行っている。 具体的には、次の研究を行った。 (1)台本テキスト中の単語の切り出し 48作品中、41作品は既に磁気データ化しているので、本研究では残り7作品の磁気データ化を行い、全作品の文章を分析対象とできるように整備した。 (2)単語に対する品詞付け (1)、(2)に作業は、ワークステーション上で日本語形態素解析システム茶筌(ChaSen)1.0を用いて行った。 (3)統計分析(汎用コンピュータ上のパッケージANALYSTを使用した。分析項目として次の項目を分析した。 〇文について 文長、1文中の単語数 〇単語について 単語長、頻度表(総単語、品詞別)、品詞の使用割合 (4)分析結果のまとめ 分析結果は、グラフ・図表にまとめ、視覚的に特徴をとらえることができるようにした。この結果については、本重点領域研究の報告書に提出するとともにホームページ上で一般に公開した。
|
Report
(1 results)
Research Products
(1 results)