• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Variation on the Spanish in Social Media

Research Project

Project/Area Number 15K02527
Research InstitutionSophia University

Principal Investigator

R・TINOCO Antonio  上智大学, 外国語学部, 教授 (80296889)

Project Period (FY) 2015-04-01 – 2019-03-31
Keywordsスペイン語学 / スペイン語圏 / コーパス言語学 / 変異言語学 / 方言学 / データベース
Outline of Annual Research Achievements

本プロジェクトの目的はスペイン語の変異言語学的な研究で、ツイッターのデータを自動的に収集し、大規模なコーパスに蓄積することにより、広大なスペイン語圏のスペイン語の語彙と文法の地理的な分析をし、語彙と文法のバリエーションの研究をすることである。例えば、語彙のバリエーションとしてはメキシコのahorita、luego luegoなど、ベネズエラのchamo、picheなど、またはアルゼンチンではboludo、mina、またはa mi lado es un porotoのような独特な言い回しを、地理的な分布および用法についても調べることが可能になった。また、hicisteとhicistesのように過去形の二人称で見られるバリエーション現象も量的な分析と、その分布を示す言語地図を作成することも可能である。
本プロジェクトの最初の3年間でツイッターのStreaming APIから取集したツイートをデータベースに蓄積し、その件数は3900万件以上であった。今年度は、さらに1200万件が増え、およそ5.3億語以上となった。これらのデータはすべて地理コード(緯度経度)が含まれている。データの検索は正規表現などを利用し、CSV、SQL、JSONなど複数のフォーマットで出力することができる。そうすることによりExcel、GIS系などのソフトで処理することにより、さらに自然言語処理が可能になった。地理情報はQGISで処理することもできるようになった。
今年度も大学の学部生及び院生に紹介して、授業でスペイン語のバリエーションの語彙・文法だけではなく、文化的な意味などで複数のアプローチを試みた。また、国際学会でスペイン語のバリエーションを語学教育でどういうふうに利用すればいいかについて論じた。なお、バルセロナ自治大学の専門家とベルリン科学アカデミーのコーパス言語学の専門家との共同研究を進め成果を上げた。

  • Research Products

    (9 results)

All 2019 2018 Other

All Int'l Joint Research (1 results) Journal Article (2 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (2 results) (of which Int'l Joint Research: 2 results) Book (1 results) Remarks (3 results)

  • [Int'l Joint Research] Austrian Academy of Sciences(オーストリア)

    • Country Name
      AUSTRIA
    • Counterpart Institution
      Austrian Academy of Sciences
  • [Journal Article] VARIGRAMA (Variacion Gramatical del Espanol en el Mundo) ―Una vision panoramica de los rasgos sintacticos del espanol―2019

    • Author(s)
      Takagaki, Toshihiro; Ueda, Hiroto; Ruiz Tinoco, Antonio
    • Journal Title

      VERBA

      Volume: - Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] Using Elasticsearch for Linguistic Analysis of Tweets in Time and Space2018

    • Author(s)
      Barbaresi, Adrian; Ruiz Tinoco, Antonio
    • Journal Title

      Proceedings of the LREC 2018 Workshop “Challenges in the Management of Large Corpora (CMLC-6)

      Volume: - Pages: 14-19

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Using Elasticsearch for Linguistic Analysis of Tweets in Time and Space2018

    • Author(s)
      Barbaresi, Adrian; Ruiz Tinoco, Antonio
    • Organizer
      LREC 2018
    • Int'l Joint Research
  • [Presentation] Usos y distribucion geografica de luego y despues2018

    • Author(s)
      Ruiz Tinoco, Antonio
    • Organizer
      III Congreso internacional sobre el espanol y la cultura hispanica
    • Int'l Joint Research
  • [Book] Lexico dialectal y lexicografia en la Iberorromania2018

    • Author(s)
      Ueda, Hiroto; Ruiz Tinoco, Antonio
    • Total Pages
      53-76
    • Publisher
      Iberoamericana Vervuert
    • ISBN
      978-3-95487-777-5
  • [Remarks] Dialectologia - Revista Electronica

    • URL

      http://www.publicacions.ub.edu/revistes/dialectologia/

  • [Remarks] Linguistic Variation

    • URL

      http://variaciones.org/

  • [Remarks] Proceedings of LREC 2018

    • URL

      http://lrec-conf.org/workshops/lrec2018/W17/pdf/16_W17.pdf

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi