Project/Area Number |
07207243
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | National Institute for Educational Policy Research |
Principal Investigator |
吉岡 亮衛 国立教育研究所, 教育情報・資料センター, 主任研究官 (40200951)
|
Project Period (FY) |
1995
|
Project Status |
Completed (Fiscal Year 1995)
|
Budget Amount *help |
¥1,700,000 (Direct Cost: ¥1,700,000)
Fiscal Year 1995: ¥1,700,000 (Direct Cost: ¥1,700,000)
|
Keywords | 新書 / 語彙 / データベース / コンピユ-タ / 統計 / 分析 / 計量 |
Research Abstract |
さまざまなテキストを読んでみると、たとえば、講談社現代新書とブルーバックスではそれぞれに共通な何らかの特徴があり、グループを分けている何らかの特徴があるらしいと直観する。そこで、手はじめに新書を特徴づけている情報は何かを統計的手法を用いて抽出することを試みた。 具体的には、次の作業を行った。 ・講談社現代新書の中の単語の切り出し (材料となるデータは、既に開発されたテキストデータベースに納められているので、本研究では、テキストの磁気データ化の必要はない。) ・単語に対する品詞付け ・統計分析(汎用コンピユ-タ上のパッケージANALYSTを使用する。 ○文について 文長、1文中の単語数 ○単語について 単語長、頻度表(総単語、品詞別)、品詞の使用割合 ・分析結果のまとめ 分析結果は、グラフ、図表にまとめ、視覚的に特徴をとらえることができるようにした。この結果については、本重点領域研究の報告書に提出した。
|
Report
(1 results)
Research Products
(1 results)