研究課題/領域番号 |
07207243
|
研究種目 |
重点領域研究
|
配分区分 | 補助金 |
研究機関 | 国立教育研究所 |
研究代表者 |
吉岡 亮衛 国立教育研究所, 教育情報・資料センター, 主任研究官 (40200951)
|
研究期間 (年度) |
1995
|
研究課題ステータス |
完了 (1995年度)
|
配分額 *注記 |
1,700千円 (直接経費: 1,700千円)
1995年度: 1,700千円 (直接経費: 1,700千円)
|
キーワード | 新書 / 語彙 / データベース / コンピユ-タ / 統計 / 分析 / 計量 |
研究概要 |
さまざまなテキストを読んでみると、たとえば、講談社現代新書とブルーバックスではそれぞれに共通な何らかの特徴があり、グループを分けている何らかの特徴があるらしいと直観する。そこで、手はじめに新書を特徴づけている情報は何かを統計的手法を用いて抽出することを試みた。 具体的には、次の作業を行った。 ・講談社現代新書の中の単語の切り出し (材料となるデータは、既に開発されたテキストデータベースに納められているので、本研究では、テキストの磁気データ化の必要はない。) ・単語に対する品詞付け ・統計分析(汎用コンピユ-タ上のパッケージANALYSTを使用する。 ○文について 文長、1文中の単語数 ○単語について 単語長、頻度表(総単語、品詞別)、品詞の使用割合 ・分析結果のまとめ 分析結果は、グラフ、図表にまとめ、視覚的に特徴をとらえることができるようにした。この結果については、本重点領域研究の報告書に提出した。
|