研究課題/領域番号 |
15K02600
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
英語学
|
研究機関 | 大阪大学 |
研究代表者 |
田畑 智司 大阪大学, 言語文化研究科(言語文化専攻), 准教授 (10249873)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2016年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2015年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | Dickens / style markers / authorial takeover / data mining / machine learning / stylometry / authorship attribution / mixed authorship / 著者識別法 / 文体 / 計量文体分析 / ディケンズ / 視覚化 / collaboration / digital humanities / stylistics / 計量文体学 / 著者推定 / ディケンズ・ジャーナル / テクストマイニング / デジタル・ヒューマニティーズ |
研究成果の概要 |
本研究では,様々なマイニング手法を比較検討することにより,検出力の優劣や適性をメタ分析によって考察し,精度の高い計量文体学的著者推定方法論の確立を試みた。特に,共著テクストにおける文体変化に対する分析感度を最適化するために,テクストの分割サイズ,ステップサイズ,分析変数のタイプや項目数を変化させた条件下で,Support Vector Machine, Nearest Shrunken Centroids, Naive Bayesなどデータマイニングで用いられている分類手法をテクストチャンクの著者推定に応用した。本研究で開発した解析法により極めて高い精度で著者交代の箇所の特定が可能となった。
|