2013 Fiscal Year Research-status Report
Project/Area Number |
23520523
|
Research Institution | Sophia University |
Principal Investigator |
|
Keywords | スペイン語額 / スペイン語圏 / コーパス言語学 / 変異言語学 / データベース / 方言学 / 国際情報交換 / Twitter |
Research Abstract |
本研究の目的は、全スペイン語圏のインターネット上の新聞の記事・ニュースをデータベース化し、スペイン語の変異を研究するためのオンラインコーパスを設計し、構築することであったが、研究が進むにつれ、Twitterのデータがスペイン語の変異を研究するには大変有効な手段だと分かり、Twitterのデータを収集し、語彙・文法のバリエーションを研究することに至った。主な特徴としては、全スペイン語圏のデータが含まれ、TwitterのAPIを利用し、正確な言語地図を作成することが出来るようになった。このようなコーパスを一般研究者・教育者が語彙、文法の変異、等の研究で利用できるようになる。 この特徴をもったコーパスを作成するために、25年度は特に次の具体的な点について達成することができた。Twitterの新しいAPI(ver1.1)を利用したプログラミングを複数のシステムを評価し、最終的にPHPとMySQLを中心にデータマイニングが進んだ。Twitterのデータを自動的にデータベース化したことによって、スペイン語の語彙・文法の研究で応用し、学会で研究発表することができた。また言語地図の作成方法として現在GISの技術を評価しながら他の研究者にも使えるようにしマニュアルを作成している。 なお、引き続き26年度も研究の成果を国内と国際学会で発表する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
新しいAPIを利用したデータ収集が進み、その方法論が確立され、実際にテストで得られたデータの一部を使って、簡易言語地図も作成し、その結果を国際学会で発表できた。
|
Strategy for Future Research Activity |
データを収集するためのサーバーのメンテナンスと研究用のソフト開発をしながら、データ収集を続け、コーパス検索用のインターフェースのテストをし、GIS法による言語地図の技術を利用し、成果を国際学会で発表する予定。
|
Expenditure Plans for the Next FY Research Funding |
スペイン語の変異を研究する目的で「スペイン語圏のオンラインコーパスの設計と構築」を始めた。スペイン語圏のオンライン新聞のRSSでデータを収集しているが、Twitterのデータも試験的に収集した。スペイン語の変異を研究する上で、Twitterのデータの共時性が有利であると判明し、その技術を習得必要がある。 ツイッターのデータを収集するためのサーバーのメンテナンスをし、データベースを完成するためのスクリプトを改善する必要がある。また、GIS法を利用するために言語地図で応用するための技術のトレーニングを受ける。共同研究でコーパスのデータを分析するので、研究打合せを行い、その成果を内外の学会で発表する。 主な費用は新しいハード・ソフトの購入、ソフト作成、文献購入と研究打合せ及び学会発表のための出張費。
|