2016 Fiscal Year Research-status Report
マイニング技術を応用した著者推定法の開発とディケンズ・ジャーナルの計量文体研究
Project/Area Number |
15K02600
|
Research Institution | Osaka University |
Principal Investigator |
田畑 智司 大阪大学, 言語文化研究科(言語文化専攻), 准教授 (10249873)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | stylometry / mixed authorship / collaboration / style markers / digital humanities / stylistics / Dickens |
Outline of Annual Research Achievements |
申請者がこれまでに活用してきた主成分分析,対応分析,Random Forests等の統計解析技法に加えて,著者推定における識別力に優れていることが示された手法 Burrows’s Delta, Craig’s Zeta(Craig & Kinney eds., 2009; Hoover, 2010)のアルゴリズムを研究し, Rで実行可能な分析ツールを開発した。さらに,工学的テクストマイニングにおいてデータ分類の精度が高い,Naいve Bayes Classifierや,Nearest Shrunken Centroids法(Jockers & Witten, 2010),Support Vector Machine等の分類器の他, 知識抽出に有効な機械学習法のアルゴリズムを研究した。さまざまな分析手法の長所・短所を比較検討し,当課題の研究対象となるデータに適合した解析処理を担う分析器のプロトタイプ開発を開始した。分析器プロトタイプを用いてサブコーパスの一部を解析するパイロットスタディを実施することにより,様々な分析手法間の比較検討に基づいて,分析器ツールを修正・最適化した。これまでに得られた研究成果の一部は,1) Digital Humanities研究者が一堂に会す国際会議Digital Humanities 2016 (クラクフ)のワークショップDigital Litrary Stylistics,および,2)文体論専門の国際会議Poetics And Linguistics Associateion 2016 (カリアリ,イタリア)において発表したほか,3)大阪大学の文理融合研究集会にてポスター発表を行った。それぞれの発表題目は次の通り。1) "Experimental Stylistics: A Meta-analysis to Evaluate Rolling Stylometry" 2) "Rolling stylometry and Dickens’s collaboration with Collins, 3) "Collaborative Texts under a Stylometric Microscope: Investigating Cases of Mixed Authorship"
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2年目までに行うことを予定していた工程をほぼ完了しており,その成果を上記の国際学会や研究集会において発表している。
|
Strategy for Future Research Activity |
今後の研究計画では,特に以下の2点について,実質的な成果を出すべく研究を進展させる予定である。 1) ディケンズ週刊ジャーナルコーパスの本格的分析,結果の文体論的考察,有効性検証 大規模コーパスの文体分析に最適化した分析プログラムを完成させ,本格的なコーパス分析研究を開始する。言語項目間の(共起)関係,テクスト間の関係,そして語彙項目の生起パターンとテクストとの相互関係を多次元空間に投影・視覚化する。一連の分析結果をディケンズの言語の内的変異及び19世紀英語発達の文脈の両面から捉え文体論的考察を展開する。 2) 研究成果の取りまとめ,成果データ・コーパス・文体分析用Rスクリプトの公開 発展させた研究の成果を Japanese Association for Digital Humanities 2017 (Kyoto)および,PALA 2017 (West Chester, Pa.)などで発表する。三年間の研究計画で得た成果を論文にまとめ,国際誌に投稿する。研究計画の遂行過程で開発するコーパスや,著者推定アプリケーションは連携関係にある 統計数理研究所,King’s College London (英国),Julius Maximillian Universitat Wurzburg (ドイツ連邦), Newcastle 大学 (豪州),Krakow 教育大学(ポーランド)の研究者との共同研究に活用する一方で,専用の配信サーバを設置し, インターネット経由で利用可能な形態にして公開する。これにより,他の研究者にこの研究資産を提供すると同時に,利用者からのフィードバックをコーパスや解析法の修正・改良に反映させて,質的により完成度の高い計量文体分析モデルの確立を目指す。
|
Causes of Carryover |
次年度は7月中旬にペンシルベニア州ウェストチェスターにて開催のPALA2017および,8月上旬にカナダ,モントリオールにて開催されるDh2017にそれぞれ出張を予定しており,出張のための予算を確保するために今年度の支出を抑えたため。
|
Expenditure Plan for Carryover Budget |
上記2学会への出張に充当する。
|
Research Products
(10 results)