研究課題/領域番号 |
20K00542
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 大阪大学 |
研究代表者 |
西岡 美樹 大阪大学, 大学院人文学研究科(外国学専攻、日本学専攻), 准教授 (30452478)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2020年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | ツリーバンク / ヒンディー語 / 日本語 / とりたて詞 / 機能 / 対照研究 / コーパス / ウェブコーパス / 小詞 / アノテーション |
研究開始時の研究の概要 |
本研究では、現代ヒンディー語のウェブコーパスCOSH(Corpus of Spoken Hindi)にHDTB(Hindi Dependency Treebank)を利用して統語情報を付与し、ヒンディー語のツリーバンクを構築する。さらに、名詞句・動詞句等の統語構造を簡単に検索できるツールを開発し、当該言語の非母語話者の研究者でも統語レベルでの量的研究を行える環境を整える。その上で、これまでの文法家による意味記述と異なる、日本語の『とりたて詞』とヒンディー語の『とりたて詞(小詞)』の機能の対照研究を行い、現代ヒンディー語および日本語の非母語話者双方への言語教育にも有用となる意味記述を行う。
|
研究成果の概要 |
本研究では、既存のウェブコーパスCOSHのデータの一部に、IIIT Hyderabadが開発したHDTB(Hindi Dependency Treebank)から作成したモデルを利用して依存構造解析を行い、UDツリーバンク(Universal Dependency Treebank)を構築した。この統語情報が付与されたデータを統語構造ベースで検索できるツールも併せて開発し、統語レベルでの量的研究を行える環境を整えた。これらを利用し、ヒンディー語の『とりたて詞(小詞)』の代表であるto、hii、bhiiと、それに相当する日本語とりたて詞「は」「も」「こそ」等の意味機能の対照分析を行った。
|
研究成果の学術的意義や社会的意義 |
本研究で開発したヒンディー語のUD(Universal Dependency)ツリーバンクと専用の検索ツールにより、当該言語の非母語話者である研究者でも統語レベルでの量的研究が行えるようになった。言語研究面では、とりたて詞を含む統語構造(名詞句、動詞句等)について、研究代表者の言語経験をもとに統語モデルを作成し、このツリーバンクを利用して短時間でとりたて詞を含むこれらの統語モデルの例の検索が行えた。これにより量的研究による客観性を担保しつつ、ヒンディー語のとりたて詞の意味機能について、日本語のそれらと対照させながら分析を行えた。この知見は言語学のみならず、高度な外国語教育にも活かせる。
|