2014 Fiscal Year Annual Research Report
Project/Area Number |
23520523
|
Research Institution | Sophia University |
Principal Investigator |
|
Project Period (FY) |
2011-04-28 – 2015-03-31
|
Keywords | スペイン語学 / スペイン語圏 / コーパス言語学 / 変異言語学 / データベース / 方言学 |
Outline of Annual Research Achievements |
本研究の目的は、全スペイン語圏のインターネット上の新聞の記事・ニュースをデータベース化し、スペイン語の変異を研究するためのオンラインコーパスを設計し、構築することであったが、研究が進むにつれ、Twitterのデータがスペイン語の変異を研究するには大変有効な手段だと分かり、Twitterのデータを収集し、語彙・文法のバリエーションを研究するに至った。主な特徴としては、全スペイン語圏のデータが含まれ、TwitterのAPIを利用し、正確な言語地図を作成することが出来るようになった。このようなコーパスを一般研究者・教育者が語彙、文法の変異、等の研究で利用できるようになる。 この特徴をもったコーパスを作成するために、25年度は特に次の具体的な点について達成することができた。Twitterの新しいAPI(ver1.1)を利用したプログラミングを複数のシステムを評価し、最終的にPHPとMySQLを中心にデータマイニングが進んだ。全体のシステムのスクリプト(データマイニングおよびデータベースのインターフェース)も改善した。Twitterのデータを自動的にデータベース化したことによって、スペイン語の語彙・文法の研究で応用し、学会で個人発表および共同研究発表することができた。また言語地図の作成方法として現在GISのソフト(オープンソース)を評価しながら他の研究者にも使えるようなマニュアルを準備している。
|