• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

トンガ語コーパス構築及び包括的言語研究における少数言語コーパスが果たす役割の考察

研究課題

研究課題/領域番号 19H01260
研究機関上智大学

研究代表者

大塚 祐子  上智大学, 外国語学部, 教授 (30794474)

研究分担者 小野 創  津田塾大学, 学芸学部, 准教授 (90510561)
研究期間 (年度) 2019-04-01 – 2024-03-31
キーワードトンガ語 / オーストロネシア諸語 / コーパス / 言語維持
研究実績の概要

本研究は、トンガ語(オーストロネシア諸語)の書きことばコーパスを構築し、得られたデータを分析し、従来の手法に基づいて立てられた統語論や心理言語学の仮説に対するコーパスデータを用いた実証的な検証を通じて、これらの分野におけるコーパスの果たす役割を考察することを目的とする。令和2年度は、コーパス構築のためのサンプルテキストの収集、データの電子化を進め、トンガでのフィールドワークを実施し、データ入力作業を依頼する現地協力者の採用、研修を経て入力作業を開始する予定であった。しかしながら、コロナウイルス感染症の世界的拡大を受け、所属機関の方針により海外渡航が禁止されたため、これらの計画の実行が不可能となった。
このため、急遽、日本国内に在住するトンガ語話者の協力者を探し、サンプルテキストの収集と、それらをウェブインターフェイスを用いて入力できるようにするために電子化する作業を令和3年1月より開始するに至った。令和2年度に処理したデータは、トンガのニュース月刊誌Matangi Tongaに寄せられた読者からの投書で、それぞれ250語程度をデータとして使用する許可を編集長から得た上で取りかかった。トンガ語表記に用いられる特殊文字(長母音を示すマクロとアクセント記号)をテキストファイルでどう表記するかをインターフェイス開発者と検討し、それぞれ該当する母音の前にアンダースコア_とスラッシュ/を用いることとした。出典のトンガ語表記をテキストファイル表記に変換する作業も含め、年度末までに約15,000語相当のテキストの電子ファイル化が完了した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

コロナ禍で計画変更が余儀なくされたため、予定していたデータ収集、電子化、入力の一連の作業の開始が大幅に遅れたため。また、国内でトンガ語話者の協力者を複数確保することは困難なため一名により作業となり、作業の速度も限られるため。

今後の研究の推進方策

テキストデータの作成に時間がかかることから、①作成した電子ファイルを一括入力できる機能、②特殊文字の変換ミスがあった場合に手動で変更が施せるようにするための特殊文字入力ボタンをウェブインターフェイスに追加して入力作業の効率化を図る。
一方で、ジャンルの異なる出版物(教会関係、政府広報)から10万語分のテキストデータの収集、電子化の作業を進める。

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi