2022 Fiscal Year Annual Research Report
ツリーバンクを利用したヒンディー語と日本語のとりたて詞の機能の対照研究
Project/Area Number |
20K00542
|
Research Institution | Osaka University |
Principal Investigator |
西岡 美樹 大阪大学, 大学院人文学研究科(外国学専攻、日本学専攻), 准教授 (30452478)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | ツリーバンク / ヒンディー語 / 日本語 / とりたて詞 / 機能 / 対照研究 / コーパス |
Outline of Annual Research Achievements |
令和4年度は、前年度までにできたツリーバンクのデータのMaltParser版とStanza版についてアノテーションの精査を行いつつ、それらを検索する専用インターフェースの開発に着手した。まず、オンラインで研究協力者らと研究打ち合わせを行い、ツリーバンクを検索する専用インターフェースを上半期中に完成させることになった。6月下旬から試験運転を開始し、海外の研究協力者らにもモニター実験の協力を仰いだ。形態や語レベルで検索する既存のCOSH(Corpus of Spoken Hindi)と違い、統語レベルで検索を行うUDツリーバンク(Universal Dependency Treebank)は、言語研究に有用だが、品詞と共に文法関係等も指定できるものであるため検索式が複雑になり、それ相応の訓練または慣れが必要なことが判明した。それを受け、開発班の研究協力者と再度打ち合わせをし、とりたて詞を含む構造を抽出するのに有用な検索式モデルを考案することにした。試行錯誤の結果、主語、目的語、斜格名詞句(副詞句)に付加または挿入されるとりたて詞を丸ごと抽出できる検索式を作成し、試験運転中のUDツリーバンクでの検索が可能となった。このヒンディー語のとりたて詞を含むパターン抽出を可能にする検索式についてまとめ、国際学会に投稿した。 一方、前年度に引き続き、ヒンディー語と日本語のとりたて詞の対照研究を進めた。研究協力者Dr. Narsimhan(デリー大学)他との自然会話から'to'、'hii'、'bhii'を含む例文をさらに収集しながら、対訳にどの日本語のとりたて詞を使うのが適切か議論を引き続き行った。特に、動詞句に付くヒンディー語のとりたて詞の例に重点を置き、日本語のとりたて詞や、副詞を使った対訳との対応関係について議論を深めた。
|
Remarks |
本研究で構築したCOSH UD Treebank(COSH Universal Dependency Treebank)は、現在試験運用中である。今後、利用者視点による改善を行うべく、現在研究協力者と意見交換を行っている。
|