• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

マイニング技術を応用した著者推定法の開発とディケンズ・ジャーナルの計量文体研究

Research Project

Project/Area Number 15K02600
Research InstitutionOsaka University

Principal Investigator

田畑 智司  大阪大学, 言語文化研究科(言語文化専攻), 准教授 (10249873)

Project Period (FY) 2015-04-01 – 2018-03-31
Keywordsstylometry / mixed authorship / collaboration / style markers / digital humanities / stylistics / Dickens
Outline of Annual Research Achievements

申請者がこれまでに活用してきた主成分分析,対応分析,Random Forests等の統計解析技法に加えて,著者推定における識別力に優れていることが示された手法 Burrows’s Delta, Craig’s Zeta(Craig & Kinney eds., 2009; Hoover, 2010)のアルゴリズムを研究し, Rで実行可能な分析ツールを開発した。さらに,工学的テクストマイニングにおいてデータ分類の精度が高い,Naいve Bayes Classifierや,Nearest Shrunken Centroids法(Jockers & Witten, 2010),Support Vector Machine等の分類器の他, 知識抽出に有効な機械学習法のアルゴリズムを研究した。さまざまな分析手法の長所・短所を比較検討し,当課題の研究対象となるデータに適合した解析処理を担う分析器のプロトタイプ開発を開始した。分析器プロトタイプを用いてサブコーパスの一部を解析するパイロットスタディを実施することにより,様々な分析手法間の比較検討に基づいて,分析器ツールを修正・最適化した。これまでに得られた研究成果の一部は,1) Digital Humanities研究者が一堂に会す国際会議Digital Humanities 2016 (クラクフ)のワークショップDigital Litrary Stylistics,および,2)文体論専門の国際会議Poetics And Linguistics Associateion 2016 (カリアリ,イタリア)において発表したほか,3)大阪大学の文理融合研究集会にてポスター発表を行った。それぞれの発表題目は次の通り。1) "Experimental Stylistics: A Meta-analysis to Evaluate Rolling Stylometry" 2) "Rolling stylometry and Dickens’s collaboration with Collins, 3) "Collaborative Texts under a Stylometric Microscope: Investigating Cases of Mixed Authorship"

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

2年目までに行うことを予定していた工程をほぼ完了しており,その成果を上記の国際学会や研究集会において発表している。

Strategy for Future Research Activity

今後の研究計画では,特に以下の2点について,実質的な成果を出すべく研究を進展させる予定である。
1) ディケンズ週刊ジャーナルコーパスの本格的分析,結果の文体論的考察,有効性検証
大規模コーパスの文体分析に最適化した分析プログラムを完成させ,本格的なコーパス分析研究を開始する。言語項目間の(共起)関係,テクスト間の関係,そして語彙項目の生起パターンとテクストとの相互関係を多次元空間に投影・視覚化する。一連の分析結果をディケンズの言語の内的変異及び19世紀英語発達の文脈の両面から捉え文体論的考察を展開する。
2) 研究成果の取りまとめ,成果データ・コーパス・文体分析用Rスクリプトの公開
発展させた研究の成果を Japanese Association for Digital Humanities 2017 (Kyoto)および,PALA 2017 (West Chester, Pa.)などで発表する。三年間の研究計画で得た成果を論文にまとめ,国際誌に投稿する。研究計画の遂行過程で開発するコーパスや,著者推定アプリケーションは連携関係にある 統計数理研究所,King’s College London (英国),Julius Maximillian Universitat Wurzburg (ドイツ連邦), Newcastle 大学 (豪州),Krakow 教育大学(ポーランド)の研究者との共同研究に活用する一方で,専用の配信サーバを設置し, インターネット経由で利用可能な形態にして公開する。これにより,他の研究者にこの研究資産を提供すると同時に,利用者からのフィードバックをコーパスや解析法の修正・改良に反映させて,質的により完成度の高い計量文体分析モデルの確立を目指す。

Causes of Carryover

次年度は7月中旬にペンシルベニア州ウェストチェスターにて開催のPALA2017および,8月上旬にカナダ,モントリオールにて開催されるDh2017にそれぞれ出張を予定しており,出張のための予算を確保するために今年度の支出を抑えたため。

Expenditure Plan for Carryover Budget

上記2学会への出張に充当する。

  • Research Products

    (10 results)

All 2017 2016

All Journal Article (2 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (7 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results) Book (1 results)

  • [Journal Article] 修辞的特徴のマイニング: Dickens と 18--19 世紀英国小説の文体2017

    • Author(s)
      田畑 智司
    • Journal Title

      『英語コーパス研究』

      Volume: 第24号 Pages: 101--122

    • Peer Reviewed / Open Access
  • [Journal Article] FLOB コーパスの意味構造:確率論的トピックモデルによる言語使用域の特徴付け2017

    • Author(s)
      田畑 智司
    • Journal Title

      統計数理研究所共同研究リポート『テクストマイニングとデジタルヒューマニティーズ』

      Volume: 386 Pages: 1--17

  • [Presentation] The Semantic Universe of Classic Fiction2017

    • Author(s)
      田畑 智司
    • Organizer
      言語研究と統計2017
    • Place of Presentation
      統計数理研究所
    • Year and Date
      2017-03-27 – 2017-03-28
  • [Presentation] Collaborative Texts under a Stylometric Microscope: Investigating Cases of Mixed Authorship2016

    • Author(s)
      Tomoji Tabata
    • Organizer
      大阪大学豊中地区 研究交流会「文×理『知』の融合」
    • Place of Presentation
      Osaka University
    • Year and Date
      2016-12-20 – 2016-12-20
  • [Presentation] Sequencing a Literary Genome of Classic Fiction: When the Humanities Meets Digital2016

    • Author(s)
      Tomoji Tabata
    • Organizer
      大阪大学豊中地区 研究交流会「文×理『知』の融合」
    • Place of Presentation
      Osaka University
    • Year and Date
      2016-12-20 – 2016-12-20
  • [Presentation] デジタルが拡張するテクスト分析と文体論:Stylometry の現在2016

    • Author(s)
      田畑 智司
    • Organizer
      英学シンポジウム―文体論で極める文学とコミュニケーション―
    • Place of Presentation
      兵庫県立大学・姫路キャンパス
    • Year and Date
      2016-11-19 – 2016-11-19
    • Invited
  • [Presentation] 修辞項目のアノテーションを活用したテクスト分析2016

    • Author(s)
      田畑 智司
    • Organizer
      英語コーパス学会シンポジウム「アノテーション(タグ付け)の功績と課題」
    • Place of Presentation
      成城大学
    • Year and Date
      2016-10-01 – 2016-10-02
  • [Presentation] Rolling stylometry and Dickens’s collaboration with Collins2016

    • Author(s)
      Tomoji Tabata
    • Organizer
      Poetics and Linguistics Association 2017
    • Place of Presentation
      Cagliari, Italy
    • Year and Date
      2016-07-27 – 2016-07-30
    • Int'l Joint Research
  • [Presentation] Experimental Stylistics: A Meta-analysis to Evaluate Rolling Stylometry2016

    • Author(s)
      Tomoji Tabata
    • Organizer
      Digital Humanities 2017 Pre-Conference Workshop "Digital Literary Stylistics"
    • Place of Presentation
      Krakow, Poland
    • Year and Date
      2016-07-12 – 2016-07-12
    • Int'l Joint Research
  • [Book] 『コーパスと英語文体』第3章「共著作品におけるDickensの文体」2016

    • Author(s)
      田畑 智司
    • Total Pages
      pp. 53--71
    • Publisher
      ひつじ書房

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi