• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

トンガ語コーパス構築及び包括的言語研究における少数言語コーパスが果たす役割の考察

研究課題

研究課題/領域番号 19H01260
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
審査区分 小区分02060:言語学関連
研究機関上智大学

研究代表者

大塚 祐子  上智大学, 外国語学部, 教授 (30794474)

研究分担者 小野 創  津田塾大学, 学芸学部, 教授 (90510561)
研究期間 (年度) 2019-04-01 – 2024-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
11,180千円 (直接経費: 8,600千円、間接経費: 2,580千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2021年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2020年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2019年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワードトンガ語 / コーパス / 少数言語 / 言語維持 / ポリネシア諸語 / オーストロネシア諸語 / 言語保持 / 言語学 / コーパス言語学 / 危機・少数言語 / 心理言語学 / 統語論
研究開始時の研究の概要

本研究はトンガ語のコーパス(約十万語からなるデータベース)を作成し、得られたデータを統語論や心理言語学の研究に活用することで、これまでコーパスがあまり活用されてこなかった分野においてコーパスの果たす役割を検証し、その効果的な活用を提案する。研究計画は、①コーパスの構築、②コーパスを使った専門分野での研究、③話しことばコーパス構築に向けた予備研究の三段階に分けられる。コーパスは少数言語の希少データを提供することで、今後の言語学領域の研究に広く役立つことは勿論、世界的な取り組みである少数言語の記録・保持活動の一例としての意義、共同作業を通じた現地協力機関に対する教育面での貢献が期待される。

研究実績の概要

業務委託先の外注業者の都合で遅延していたコーパス構築用のデータ入力のためのウェブインターフェイスの改修が完了し、これまでに蓄積したトンガ語のテキストデータ(約30万語)をファイルごとに一括入力できる状態になった。
ウェブ上で入力ができるようになるまでは、その後に予定されている作業(文レベルの英訳の付与、語レベルのアノテーションの付与)に取りかかることが不可能であるため、入力がより速く正確に進められるよう、トンガ語話者である協力者が作成したテキストファイル(約1000ファイル)の内容と原典との整合性の確認、特殊文字が変換用の表記(アクセントは母音の前に/、長母音は母音の前に_)に正しく置き換えられているかのチェックを行い、必要な修正を施した。また、作業の遅れを取り戻す方策として、入力作業をさらに効率よくするために、テキストファイルに文ごとの英訳を付与し、英訳も一緒に一括入力が可能な形に整えた。
2023年9月にはトンガ国立大学の教育芸術人文学部の英語専攻及びトンガ語専攻の学生と教員に向けて、トンガ語の書き言葉コーパスに関するワークショップを行い、プロジェクトの目的と意義を説明するとともに、実際にウェブページを見せながら英訳や品詞情報のアノテーション付与の具体的な方法を説明した。検索可能なトンガ語のデータベースへの関心は高く、積極的に作業に関わりたいと申し出る学生が多くいたため、今後、トンガ語の品詞分類に関する講義やアノテーション付与の仕方の実践的なワークショップを実施することが決まった。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

インターフェイスの改修を委託していた外注業者の都合により、改修が大幅に遅れたため、予定していた入力作業に取りかかることができなかったが、データ入力後に英訳をインターフェイス上で付与するという手続きから、テキストファイル自体に英訳を付与し一括入力する形に変更して、改修作業完了後の作業のスピードアップを図った。

今後の研究の推進方策

英訳を付与した上でデータベースに一括入力できるようになったので、テキストファイルに文ごとの英訳を付与する作業を進める一方で、英訳付与が完了したファイルから順に入力作業を同時進行で進める。品詞情報のアノテーション付与に関するワークショップを行い、入力済みデータについてウェブ上でアノテーションを付与する作業を順次進める。

報告書

(4件)
  • 2022 実績報告書
  • 2021 実績報告書
  • 2020 実績報告書
  • 2019 実績報告書
  • 研究成果

    (1件)

すべて 2023

すべて 学会発表 (1件) (うち国際学会 1件)

  • [学会発表] Linguists’ Contribution to Pukepuke Fonua: Tongan Language Corpus Projects2023

    • 著者名/発表者名
      Yuko Otsuka
    • 学会等名
      the 19th Bi-Annual Tonga Research Association Conference Pukepuke Fonua 2023
    • 関連する報告書
      2022 実績報告書
    • 国際学会

URL: 

公開日: 2019-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi