• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

科学読み物の語彙分析にもとづく特徴の抽出

Research Project

Project/Area Number 08207238
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Research InstitutionNational Institute for Educational Policy Research

Principal Investigator

吉岡 亮衛  国立教育研究所, 教育情報・資料センター, 室長 (40200951)

Project Period (FY) 1996
Project Status Completed (Fiscal Year 1996)
Budget Amount *help
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 1996: ¥1,400,000 (Direct Cost: ¥1,400,000)
Keywordsブルーバックス / 語彙 / データベース / コンピュータ / 統計 / 分析 / 計量 / 新書
Research Abstract

さまざまなテキストを読んでみると、たとえば、講談社現代新書とブルーバックスではそれぞれに共通な何らかの特徴があり、グループを分けている何らかの特徴があるらしいと直観する。そこで、昨年度は新書を特徴づけている情報は何かを統計的手法を用いて抽出することを試みたので、本年度はブルーバックスの特徴を同様の手法を用いて分析を行った
具体的には、次の作業を行った。
(1)講談社現代ブルーバックスの中の単語の切り出し
(材料となるデータは、既に開発されたテキストデータベースに納められているので、本研究では、テキストの磁気データ化の必要はない。)
(2)単語に対する品詞付け
(1)、(2)の作業は、ワークステーション上で日本語形態素解析システム茶筌(ChaSen)1.0を用いて行った。
(3)統計分析(汎用コンピュータ上のパッケージANALYSTを使用した。
○文について
文長、I文中の単語数
○単語について
単語長、頻度表(総単語、品詞別)、品詞の使用割合
(4)分析結果のまとめ
分析結果は、グラフ・図表にまとめ、視覚的に特徴をとらえることができるようにした。この結果については、本重点領域研究の報告書に提出した。

Report

(1 results)
  • 1996 Annual Research Report
  • Research Products

    (1 results)

All Other

All Publications (1 results)

  • [Publications] 吉岡亮衛: "科学読み物の語彙分析にもとづく特徴の抽出" 重点領域研究「人文科学とコンピュータ」報告書. 1. (1997)

    • Related Report
      1996 Annual Research Report

URL: 

Published: 1996-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi