• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network

Research Project

Project/Area Number 18H00675
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Review Section Basic Section 02080:English linguistics-related
Research InstitutionOsaka University

Principal Investigator

田畑 智司  大阪大学, 言語文化研究科(言語文化専攻), 教授 (10249873)

Project Period (FY) 2018-04-01 – 2022-03-31
Project Status Granted (Fiscal Year 2021)
Budget Amount *help
¥15,730,000 (Direct Cost: ¥12,100,000、Indirect Cost: ¥3,630,000)
Fiscal Year 2021: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2020: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2019: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2018: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Keywordsコーパス文体論 / デジタルヒューマニティーズ / 国際連携 / テクスト分析 / テクストマイニング / 機械学習 / 国際連携拠点 / テクスト分析方法論 / 国際連携基盤創成 / トピックモデル / ワードエンベディング / 文体 / 小説言語 / フォーラム / トピックモデリング
Outline of Annual Research Achievements

まず最初に取り組んだ仕事は,後期近代英語フィクションコーパスの質的精緻化である。国内外の関連研究を行う研究者とのデータ相互運用や共用,協働を実現する基盤を整備するために,国際的電子文書データ互換規格であるTEI P5に準拠したテクストのマークアップとアノテーションを施した。この工程のうち,マークアップでは,テクストの読みに基づく質的解釈や判断が要求される局面が往々にして発生するため,完全な自動化は見込めない。そのため,合わせて2年以上をかけて,テクストの構造を可視化するよう階層的に整理されたタグを埋め込んだ。さらに,TreeTaggerを利用して,CLAWS C5タグセットでの品詞標識付与(アノテーション)を施した。コーパスを構成している全てのテクストにC5タグを付与することにより,語彙頻度をBNC,COCA, COHAなどの代表的大規模コーパスと直接比較できるようコーパスを整備した。他方,構築したコーパスをもとに,トピックモデルおよびワードエンベディング法による,文体的特徴の研究を実施した。これまでの研究成果の一部は,Digital Humanities Day(大英図書館,2019年5月)での講演において提示したほか,国際文体論学会PALA2019(英国Liverpool)にてトピックモデルを応用した通時的文体研究について口頭発表し,先端的研究者によるリビューを受けた。また,2021年7月には英国Nottinghamより配信された国際文体論学会PALA2021における基調講演(オンライン)でもこれまでの成果を俯瞰的に提示した。国際連携基盤を形成する上では,対面でのフォーラム,会合や情報交換会が不可欠であるが,パンデミックによりそれが実施できていない。オンラインで部分的な情報交換等はできているものの,国際連携基盤の形成は進行が遅れている。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

2019年度の研究計画は新型コロナウィルスによるパンデミックにより,二度に及ぶ計画の繰越を含め,予定を大幅に変更することを余儀なくされた。特に,国際連携基盤を形成する上では,対面でのフォーラム,会合や情報交換会が不可欠であり,本研究計画を遂行する上で極めて重要な要素であるが,連携研究機関の方針により対面での会合が実施できなかったことによる。ただし,講演会やワークショップをオンラインで開催するなど,部分的には対外的な研究集会によって新たな連携関係を築くこともできている。

Strategy for Future Research Activity

北米や欧州を中心に,学会やワークショップ等の対面開催が徐々に戻りつつある。そのため,今後はこれまでに蓄積してきた研究成果をもとに,国際連携基盤の形成を加速させる方針である。

Report

(2 results)
  • 2019 Annual Research Report
  • 2018 Annual Research Report

Research Products

(26 results)

All 2021 2020 2019 2018 Other

All Int'l Joint Research (3 results) Journal Article (3 results) Presentation (16 results) (of which Int'l Joint Research: 10 results,  Invited: 10 results) Book (3 results) Funded Workshop (1 results)

  • [Int'l Joint Research] ヴュルツブルク大学(ドイツ)

    • Related Report
      2019 Annual Research Report
  • [Int'l Joint Research] オランダ先端人文社会科学研究所 (NIAS)(オランダ)

    • Related Report
      2019 Annual Research Report
  • [Int'l Joint Research] University of Wurzburg/University of Trier(ドイツ)

    • Related Report
      2018 Annual Research Report
  • [Journal Article] Latent Topics in British Classic Fiction : Using LDA to classify texts into meaningful groups2020

    • Author(s)
      田畑 智司
    • Journal Title

      言語文化共同研究プロジェクト

      Volume: 2019 Pages: 47-58

    • DOI

      10.18910/76991

    • NAID

      120006883716

    • Related Report
      2019 Annual Research Report
  • [Journal Article] Mapping Dickens’s Style in the Network of Words, Topics, and Texts2018

    • Author(s)
      Tomoji Tabata
    • Journal Title

      テクストマイニングと デジタルヒューマニティーズ 2017

      Volume: 2018

    • Related Report
      2018 Annual Research Report
  • [Journal Article] Digital Humanities: デジタルで拡張する言語文化学研究2018

    • Author(s)
      田畑 智司
    • Journal Title

      テクストマイニングと デジタルヒューマニティーズ 2017

      Volume: 2018

    • Related Report
      2018 Annual Research Report
  • [Presentation] Different paths to the same peak: Digital humanities and Spitzerian stylistics2021

    • Author(s)
      Tomoji Tabata
    • Organizer
      The Poetics and Linguistics Association International Conference PALA 2021 Nottingham
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Language Action Types and the Semantics of Texts: Using Rhetorical Annotation to Classify Texts into Meaningful Groups2020

    • Author(s)
      Tomoji Tabata
    • Organizer
      2020 Korea-Japan Symposium on Digital Humanities
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] 「ズームイン・ズームアウト―デジタルヒューマニティーズとテクストの「読み」―」2020

    • Author(s)
      田畑 智司
    • Organizer
      Galeシンポジウム2020『第2回 デジタル人文学への誘い』
    • Related Report
      2019 Annual Research Report
    • Invited
  • [Presentation] Digital Humanities as Non-Linear Reading: Style in classic British fiction2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      DADH 2019: The Tenth International Conference of Digital Archives and Digital Humanities
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] “Zooming in and zooming out”: Digital humanities and the (macro-/micro-) reading of texts2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      Digital Humanities Lecture at National Chengchi University, Taipei, Taiwan
    • Related Report
      2019 Annual Research Report
    • Invited
  • [Presentation] Dickens, Collins and their Collaborations: Pinpointing style change in collaborative texts2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      Trans Media World Literature Institute International Colloquium: Transhumanism, Trans Media, World Literature, and Digital Humanities, Dongguk University, Seoul, South Korea
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Experimental Stylometry2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      Stylometry workshop Amsterdam at Advanced Study in the Humanities and Social Sciences (NIAS, Amsterdam, the Netherlands)
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Tracing Thematic Transition in Dickens’s Literature and Journalism2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      The Poetics and Linguistics Association International Conference PALA 2019 Liverpool
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Reading texts non-linearly: Classic British fiction and Dickens2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      Gale Digital Humanities Day at the British Library
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Corpus approach to semantic style: Body language, n-grams, and topics2019

    • Author(s)
      Tomoji Tabata
    • Organizer
      Osaka Symposium on Corpus Stylistics
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Word Vectors and Semantic Style in Classic Fiction2019

    • Author(s)
      田畑 智司
    • Organizer
      「言語研究と統計2019」
    • Related Report
      2018 Annual Research Report
  • [Presentation] Dickens in Vector Space: Word Embeddings and Semantic Profiling of Style2018

    • Author(s)
      Tomoji Tabata
    • Organizer
      Poetics And Linguistics Association (PALA) 2018
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Collaborative Texts under a Stylometric Microscope: Investigating Texts of Mixed Authorship2018

    • Author(s)
      Tomoji Tabata
    • Organizer
      英語コーパス学会第44回大会
    • Related Report
      2018 Annual Research Report
  • [Presentation] Lexical Diversity in Classic British Fiction2018

    • Author(s)
      Tomoji Tabata
    • Organizer
      Osaka-Wurzburg Collaborative Workshop: Cross-Linguistics Perspectives on Complexity in Literary Texts
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Stylometry and Classic British Fiction2018

    • Author(s)
      田畑 智司
    • Organizer
      日本文体論学会第114回大会
    • Related Report
      2018 Annual Research Report
    • Invited
  • [Presentation] デジタルが変える「読み」― テクスト、データ、ディスタントリーディング ―2018

    • Author(s)
      田畑 智司
    • Organizer
      Galeシンポジウム2018「デジタル人文学への誘い」
    • Related Report
      2018 Annual Research Report
    • Invited
  • [Book] テクストマイニングとデジタルヒューマニティーズ 20212021

    • Author(s)
      田畑 智司(編)
    • Total Pages
      68
    • Publisher
      大阪大学大学院言語文化研究科
    • Related Report
      2019 Annual Research Report
  • [Book] テクストマイニングとデジタルヒューマニティーズ 20202020

    • Author(s)
      田畑 智司(編)
    • Total Pages
      96
    • Publisher
      大阪大学大学院言語文化研究科
    • Related Report
      2019 Annual Research Report
  • [Book] テクストマインニングとデジタルヒューマニティーズ20172018

    • Author(s)
      田畑 智司,杉山 真央,土村 成美
    • Total Pages
      90
    • Publisher
      大阪大学大学院言語文化研究科
    • Related Report
      2018 Annual Research Report
  • [Funded Workshop] Digital Humanities Workshop Osaka 20202020

    • Related Report
      2019 Annual Research Report

URL: 

Published: 2018-04-23   Modified: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi