研究課題/領域番号 |
26730162
|
研究機関 | 東洋大学 |
研究代表者 |
鈴木 崇史 東洋大学, 社会学部, 准教授 (70507037)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 計算文体論 / 計量情報学 / テキストマイニング / 被験者実験 / 機械学習 |
研究実績の概要 |
本研究では、統計的データ解析により、多種テキストからコミュニケーション・スタイルを抽出し、さらに、被験者実験により、多種テキストに対するテキスト受信者(読み手)の態度を明らかにすることを目的とする。自然言語処理技術の発展と大量データの蓄積により、テキスト解析に対する学術的、社会的需要はますます高まっている。本研究では、実データから実験用テキストデータを作成し、統計的データ解析に加え、被験者実験を用いることで、多種テキストの特徴とコミュニケーション・スタイルの関係、これらと受信者の態度の関係を明らかにし、テキスト解析の方法論的拡張をはかり、テキスト・コミュニケーションの実態を実証的に明らかにすることを目指す。 本年度は、テキストデータ、実験データの収集を行うとともに、基礎的なテキストデータ解析を行うことで、諸テキストの特徴を明らかにした。Webデータのクロール、各種テキストデータの収集、整理、整形、必要なメタデータの挿入を行い、作成したテキストファイルに対して、形態素解析、係り受け解析を適用し、基本的なテキスト統計量(文章長、パラグラフ長、文長、文字 (n-gram) 頻度、形態素 (n-gram) 頻度、共起頻度、係り受け頻度、要約特徴量)を計算した。多変量解析を適用することで、多種テキストの位置関係を明らかにし、テキスト特徴量への影響要因を調査した。また、フィールドでのインタビュー、アンケートを行い、コミュニケーションの基礎的特徴を検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究の目的に記載した通り、テキストデータ収集、基礎的な解析ともに概ね計画の通りに推移している。
|
今後の研究の推進方策 |
前年度の研究遂行状況を踏まえつつ、研究目的、当初計画に従って研究を遂行する。
|
次年度使用額が生じた理由 |
他の研究費の採択、研究成果発表状況の前後による。
|
次年度使用額の使用計画 |
次年度以降に使用を予定する。具体的には、成果発表(国内、国際会議)、英文校正費用、消耗品購入等に充当する。
|