2012 Fiscal Year Research-status Report
Project/Area Number |
23700288
|
Research Institution | Toyo University |
Principal Investigator |
鈴木 崇史 東洋大学, 社会学部, 講師 (70507037)
|
Keywords | 人文情報学 / 計量情報学 / 計算文体論 / テキスト分析 / 図書館情報学 |
Research Abstract |
本研究は、計算文体論アプローチを用いて、多種メディアテキストからコミュニケーション・スタイルを抽出、分析することを目指すものである。 本年度は、昨年度に引き続き、多種メディアテキストの収集、電子化をすすめるとともに、統計解析によって、多種テキストの位置関係を明らかにし、また、テキスト特徴量への影響要因を検討した。 具体的には、政治文書、tweet、歌詞、新聞、小説等、多種テキストの収集、電子化をすすめるとともに、語の使用頻度、語彙指標、n-gram等の特徴量を計量し、カーネル主成分分析、ランダムフォレスト機械学習法等を用いて、それらのテキストの位置関係を明らかにするとともに、テキスト特徴量への影響要因を検討した。さらに、他のデータをも利用して、有用な分析手法の検討を行った。 とりわけ、歌詞については、女性グループ歌手の分析をすすめ、時代による変化、グループごとの特性を社会学的、言語学的に考察した。小説については、伊坂幸太郎作品を例として、視点による小説の書き分けを文体論的に考察した。新聞については、五代紙の比較分析を行い、その内容、文体上の差異を明らかにし、また、時代、イデオロギーとの関連性を考察した。政治テキストに関しては、これまで継続的に行ってきた研究を整理し、その位置づけと今後の展望を明らかにした。また、分析手法に関しては、Q&Aコミュニティデータを利用し、ネットワーク中心性指標の有効性を検討し、世論調査データを利用して、ランダムフォレスト機械学習法の大規模データへの有用性を検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
テキストデータの収集、統計分析に関しては、想定以上の成果が得られた。一方で、コミュニケーション類型の指標化については、一定の成果を得たものの、さらに次年度以降検討の余地がある。
|
Strategy for Future Research Activity |
当初計画通りの推進を予定する。
|
Expenditure Plans for the Next FY Research Funding |
11643円の繰り越しは、消耗品の発注、納品状況によるものであり、次年度適切に利用する。
|