研究課題/領域番号 |
26730162
|
研究機関 | 東洋大学 |
研究代表者 |
鈴木 崇史 東洋大学, 社会学部, 准教授 (70507037)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 計算文体論 / 計量情報学 / テキストマイニング / 被験者実験 / 機械学習 |
研究実績の概要 |
本研究では、統計的データ解析により、多種テキストからコミュニケーション・スタイルを抽出し、さらに、被験者実験により、多種テキストに対するテキスト受信者(読み手)の態度を明らかにすることを目的とする。自然言語処理技術の発達と対象データの蓄積により、テキスト解析に対する学術的、社会的需要はますます高まっている。本研究では、実データから実験用テキストデータを作成し、統計的データ解析に加え、被験者実験を用いることで、多種テキストの特徴とコミュニケーション・スタイルの関係、これらと受信者の態度の関係を明らかにし、テキスト解析の方法論的拡張をはかり、テキスト・コミュニケーションの実態を実証的に明らかにすることを目指す。 本年度は、前年度までに収集されたデータ、知見をもとに、多変量解析、機械学習、被験者実験等により、テキスト特徴量とコミュニケーション・スタイルの関係を実証的に分析した。 具体的には、法令文書、新聞、雑誌、歌詞、Web等の多種多様なデータにつき、bag-of-words、語彙指標、n-gram等種々の特徴量を計量し、カーネル主成分分析、ランダムフォレスト機械学習法、サポートベクターマシン等種々の統計分析手法を適用し、また、被験者実験を行うことで、テキスト特徴量とコミュニケーション・スタイルの特徴の関係を明らかにし、これについて、社会学、言語学、情報学的、社会情報学的見地から分析、解釈を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究目的に記載の通りに、概ね計画通りに推移している。一方で、追加実験、成果発表を継続する必要がある。
|
今後の研究の推進方策 |
追加実験、成果発表を継続し、研究全体の総括を行う。
|
次年度使用額が生じた理由 |
他の予算使用状況、研究成果発表状況、追加実験の必要性等による。
|
次年度使用額の使用計画 |
追加実験、研究成果発表に伴う、諸経費に充当する。
|