• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

トンガ語コーパス構築及び包括的言語研究における少数言語コーパスが果たす役割の考察

研究課題

研究課題/領域番号 19H01260
研究機関上智大学

研究代表者

大塚 祐子  上智大学, 外国語学部, 教授 (30794474)

研究分担者 小野 創  津田塾大学, 学芸学部, 教授 (90510561)
研究期間 (年度) 2019-04-01 – 2024-03-31
キーワードトンガ語 / オーストロネシア諸語 / コーパス / 言語維持
研究実績の概要

令和3年度は、前年度末に開始したテキストデータの収集及び電子ファイル化をさらに進め、異なるソース(教会のニューズレター、政府の広報)から合わせて17万語相当のテキストデータの電子化を完了した。この作業はトンガ語母語話者が担当し、出典元の表記にタイプミスがないか、特ににGlottal stop、長母音、定性アクセントの表記が抜け落ちている箇所がないかを中心にチェックし、必要な箇所に訂正を施した上で、これらのトンガ語表記をテキストファイル用の表記(アンダースコア、スラッシュ)に変換するという流れで進めた。
続いて、完成した電子データと出典元との内容を照合してダブルチェックを行い、重複したファイルがないか、特殊文字の表記が正しいかを確認しつつ、入力作業に向けてファイルの最終調整を行った。
前年度までに予定されていた作業に遅れが出ていたため、データ入力に用いるウェブインターフェイスの機能について、より効率的に入力が進められるよう、当初計画していた一文ずつの入力ではなく、ファイルごとの一括入力ができるように変更した。しかしながら、この変更を含んだウェブインターフェイスの納期が開発請負者の都合により遅れたため、令和4年1月までに開始する予定であった入力作業を開始するには至らなかった。
一方で、インターフェイスの検索機能に関する検討を重ね、検索結果で前後の文脈がわかるような表示がされるようするなど、検索結果から出典元のデータを閲覧できるようにする等、より効率的にコーパスを利用するために必要な要件をまとめた。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

インターフェイス開発請負者の事情で納期が遅れ、入力作業の開始が遅れてたため。

今後の研究の推進方策

インターフェイスの機能追加が完了次第、電子ファイルの一括入力でデータベースを構築し、トンガ語話者による文レベルの英訳を付与する作業を実施する。トンガへの渡航が可能となったので、現地で協力者を複数採用し、語レベルのアノテーション付与作業にとりかかる。

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi