2014 Fiscal Year Research-status Report
統計的データ解析と被験者実験を用いたテキスト・コミュニケーション研究
Project/Area Number |
26730162
|
Research Institution | Toyo University |
Principal Investigator |
鈴木 崇史 東洋大学, 社会学部, 准教授 (70507037)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 計算文体論 / 計量情報学 / テキストマイニング / 被験者実験 / 機械学習 |
Outline of Annual Research Achievements |
本研究では、統計的データ解析により、多種テキストからコミュニケーション・スタイルを抽出し、さらに、被験者実験により、多種テキストに対するテキスト受信者(読み手)の態度を明らかにすることを目的とする。自然言語処理技術の発展と大量データの蓄積により、テキスト解析に対する学術的、社会的需要はますます高まっている。本研究では、実データから実験用テキストデータを作成し、統計的データ解析に加え、被験者実験を用いることで、多種テキストの特徴とコミュニケーション・スタイルの関係、これらと受信者の態度の関係を明らかにし、テキスト解析の方法論的拡張をはかり、テキスト・コミュニケーションの実態を実証的に明らかにすることを目指す。 本年度は、テキストデータ、実験データの収集を行うとともに、基礎的なテキストデータ解析を行うことで、諸テキストの特徴を明らかにした。Webデータのクロール、各種テキストデータの収集、整理、整形、必要なメタデータの挿入を行い、作成したテキストファイルに対して、形態素解析、係り受け解析を適用し、基本的なテキスト統計量(文章長、パラグラフ長、文長、文字 (n-gram) 頻度、形態素 (n-gram) 頻度、共起頻度、係り受け頻度、要約特徴量)を計算した。多変量解析を適用することで、多種テキストの位置関係を明らかにし、テキスト特徴量への影響要因を調査した。また、フィールドでのインタビュー、アンケートを行い、コミュニケーションの基礎的特徴を検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の目的に記載した通り、テキストデータ収集、基礎的な解析ともに概ね計画の通りに推移している。
|
Strategy for Future Research Activity |
前年度の研究遂行状況を踏まえつつ、研究目的、当初計画に従って研究を遂行する。
|
Causes of Carryover |
他の研究費の採択、研究成果発表状況の前後による。
|
Expenditure Plan for Carryover Budget |
次年度以降に使用を予定する。具体的には、成果発表(国内、国際会議)、英文校正費用、消耗品購入等に充当する。
|