• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

1997 Fiscal Year Annual Research Report

政治テキストの内容分析システムの構築

Research Project

Project/Area Number 07552001
Research InstitutionThe University of Tokyo

Principal Investigator

田中 明彦  東京大学, 東洋文化研究所, 助教授 (30163497)

Co-Investigator(Kenkyū-buntansha) 服部 正太  構造計画研究所, 創造工学部, 部長
野中 尚人  学習院大学, 法学部, 教授 (90264697)
原田 至郎  東京大学, 東洋文化研究所, 助手 (10282708)
Keywords政治テキスト / 内容分析 / 頻度分析 / 主成分分析 / クラスター分析
Research Abstract

本年度は、最終年度として政治テキストの分析ソフトウェアシステムとして『Content Analyzer』を完成させた。昨年度までの作業で、複数テキスト・ファイルからの検索と該当個所の抽出、概念の単純頻度計測および同時出現頻度の計測は実現していたが、本年度はこれらのデータから主成分分析およびクラスター分析を行うルーティンを追加し、テキストの分析システムとしての一貫性を持ったソフトウェアとして『Content Analyzer』を完成させるための作業を行った。なお、本作業で作成したソフトウェアについては、当初CASPT(Content Analyzing System of Political Texts)というものを考えていたが、実現したソフトウェアの実用範囲は必ずしも政治テキストのみにとどまらない汎用性をもつことにかんがみ、より一般的な『Content Analyzer』とした。また、本年度の作業としては、『Content Analyzer』の研究補助ソフトとしての有用性を試す意味から、現実の政治テキストとして、総理大臣の国会演説を利用して、さまざまな分析を試みた。その結果、複数テキスト・ファイルからの検索・抽出といった最も単純な機能も、きわめて有用であることが確認されたし、単純頻度計測や同時出現頻度の計測も、汎用の表計算ソフトと結び付けることで、政治学的に意味ある分析を容易にできる。また、主成分分析やクラスター分析のルーティンを加えたことによって、複数テキスト間の類似度が視覚的に判断できるようになった。市販のソフトの中には、複数テキスト間の類似度を示すものがいくつか登場してきているが、いかなる基準でそれらのテキストが類似しているのかを確認する方法がない。『Content Analyzer』は、その点、みずからの基準をはっきりさせた上で、複数テキスト間の類似度を計測できるため、研究ツールとしては、より有用性が高いと思われる。

URL: 

Published: 1999-03-15   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi