研究課題/領域番号 |
19H01260
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 上智大学 |
研究代表者 |
大塚 祐子 上智大学, 外国語学部, 教授 (30794474)
|
研究分担者 |
小野 創 津田塾大学, 学芸学部, 教授 (90510561)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
11,180千円 (直接経費: 8,600千円、間接経費: 2,580千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2021年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2020年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2019年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | トンガ語 / コーパス / 少数言語 / オーストロネシア諸語 / 言語維持 / 言語保持 / 言語学 / コーパス言語学 / 危機・少数言語 / 心理言語学 / 統語論 |
研究開始時の研究の概要 |
本研究はトンガ語のコーパス(約十万語からなるデータベース)を作成し、得られたデータを統語論や心理言語学の研究に活用することで、これまでコーパスがあまり活用されてこなかった分野においてコーパスの果たす役割を検証し、その効果的な活用を提案する。研究計画は、①コーパスの構築、②コーパスを使った専門分野での研究、③話しことばコーパス構築に向けた予備研究の三段階に分けられる。コーパスは少数言語の希少データを提供することで、今後の言語学領域の研究に広く役立つことは勿論、世界的な取り組みである少数言語の記録・保持活動の一例としての意義、共同作業を通じた現地協力機関に対する教育面での貢献が期待される。
|
研究実績の概要 |
令和3年度は、前年度末に開始したテキストデータの収集及び電子ファイル化をさらに進め、異なるソース(教会のニューズレター、政府の広報)から合わせて17万語相当のテキストデータの電子化を完了した。この作業はトンガ語母語話者が担当し、出典元の表記にタイプミスがないか、特ににGlottal stop、長母音、定性アクセントの表記が抜け落ちている箇所がないかを中心にチェックし、必要な箇所に訂正を施した上で、これらのトンガ語表記をテキストファイル用の表記(アンダースコア、スラッシュ)に変換するという流れで進めた。 続いて、完成した電子データと出典元との内容を照合してダブルチェックを行い、重複したファイルがないか、特殊文字の表記が正しいかを確認しつつ、入力作業に向けてファイルの最終調整を行った。 前年度までに予定されていた作業に遅れが出ていたため、データ入力に用いるウェブインターフェイスの機能について、より効率的に入力が進められるよう、当初計画していた一文ずつの入力ではなく、ファイルごとの一括入力ができるように変更した。しかしながら、この変更を含んだウェブインターフェイスの納期が開発請負者の都合により遅れたため、令和4年1月までに開始する予定であった入力作業を開始するには至らなかった。 一方で、インターフェイスの検索機能に関する検討を重ね、検索結果で前後の文脈がわかるような表示がされるようするなど、検索結果から出典元のデータを閲覧できるようにする等、より効率的にコーパスを利用するために必要な要件をまとめた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
インターフェイス開発請負者の事情で納期が遅れ、入力作業の開始が遅れてたため。
|
今後の研究の推進方策 |
インターフェイスの機能追加が完了次第、電子ファイルの一括入力でデータベースを構築し、トンガ語話者による文レベルの英訳を付与する作業を実施する。トンガへの渡航が可能となったので、現地で協力者を複数採用し、語レベルのアノテーション付与作業にとりかかる。
|