本研究では、統計的データ解析により、多種テキストからコミュニケーション・スタイルを抽出し、さらに、被験者実験により、多種テキストに対するテキスト受信者(読み手)の態度を明らかにすることを目的とする。自然言語処理技術の発達と対象データの蓄積により、テキスト解析に対する学術的、社会的需要はますます高まっている。本研究では、実データから実験用テキストデータを作成 し、統計的データ解析に加え、被験者実験を用いることで、多種テキストの特徴とコミュニケーション・スタイルの関係、これらと受信者の態度の関係を明らかにし、テキスト解析の方法論的拡張をはかり、テキスト・コミュニケーションの実態を実証的に明らかにすることを目指す。 本年度は、前年度までに収集されたデータ、知見をもとに、多変量解析、機械学習、被験者実験等により、テキスト特徴量とコミュニケーション・スタイルの関係を実証的に分析した。具体的には、法令文書、新聞、雑誌、歌詞、Web等の多種多様なデータにつき、bag-of-words、語彙指標、n-gram等種々の特徴量を計量し、カーネル主成分分析、ランダムフォレスト機械学習法、サポートベクターマシン等種々の統計分析手法を適用し、また、被験者実験を行うことで、テキスト特徴量とコミュニケーション・スタイルの特徴の関係を明らかにし、これについて、社会学、言語学、情報学的、社会情報学的見地から分析、解釈を行った。さらに、研究全体を総括し、方法論的、実証的知見を整理し、今後の課題を明らかにした。
|