研究課題/領域番号 |
20H01255
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 東京外国語大学 |
研究代表者 |
齋藤 スニサー 東京外国語大学, 世界言語社会教育センター, 教授 (60791671)
|
研究分担者 |
野元 裕樹 東京外国語大学, 大学院総合国際学研究院, 准教授 (10589245)
ソンラートラムワニッチ ウィラット 武蔵野大学, データサイエンス学部, 教授 (20849062)
谷口 龍子 東京外国語大学, 大学院国際日本学研究院, 准教授 (20570659)
南 潤珍 東京外国語大学, 大学院総合国際学研究院, 教授 (30316830)
SRI BUDILESTARI 立命館アジア太平洋大学, 言語教育センター, 講師 (80833342)
三宅 良美 秋田大学, 国際資源学研究科, 教授 (70396547)
春日 淳 神田外語大学, 外国語学部, 教授 (80364925)
岡野 賢二 東京外国語大学, 大学院総合国際学研究院, 准教授 (60376829)
トゥザ ライン 東京外国語大学, 世界言語社会教育センター, 准教授 (90868879)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2022年度: 8,970千円 (直接経費: 6,900千円、間接経費: 2,070千円)
2021年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2020年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 代名詞代用表現 / 呼びかけ表現 / 言語学 / 言語資源開発 / アジア諸語 / 人称代名詞 / コーパスアノテーション / 言語資源 |
研究開始時の研究の概要 |
本研究は、人称代名詞ではないものの、話し手・聞き手を指示する「代名詞代用表現(pronoun substitute)」およびそれと関連の深い「呼びかけ表現(address term)」について、8言語(日本語、朝鮮語、マレー語、インドネシア語、ジャワ語、タイ語、ベトナム語、ビルマ語)を対象とし、通言語的研究を行う。 「どのような表現が代名詞代用表現・呼びかけ表現として用いられるか?」という問いを立て、個別言語レベル、通言語レベルで、多言語の専門家が協同で記述・分析、言語資源構築を行う。 自然言語処理との連携を重視する。多言語言語資源を用いる他、自然言語処理で直接利用可能な大規模言語資源を構築する。
|
研究実績の概要 |
本研究は、日本語の「お母さん」のように、人称代名詞ではないものの、話し手・聞き手を指示する「代名詞代用表現(pronoun substitute)」およびそれと関連の深い「呼びかけ表現(address term)」について、8言語(日本語、朝鮮語、マレー語、インドネシア語、ジャワ語、タイ語、ベトナム語、ビルマ語)を対象とし、通言語的研究を行う。「どのような表現が代名詞代用表現・呼びかけ表現として用いられるか?」という問いを立て、個別言語レベル、通言語レベルで、多言語の専門家が協同で記述・分析、言語資源構築を行う。 今年度は、3回の研究会を対面とオンラインで実施した。第7回研究会(回数は初年度からの通算)では、共通調査票に基づく調査の結果の報告を4言語(日本語、朝鮮語、マレー語、ジャワ語)について行った。その後、コーパスアノテーションで用いるツールやコーパスの選定について全員で議論した。 第8回研究会では、コーパスアノテーションを実際に開始するための準備をした。まず、UAM Corpus Toolまたはdoccanoをインストールし、設定を行った。その後、練習としてTUFS Asian Language Parallel Corpus (TALPCo)のデータに実際にアノテーション付与を行った。研究会後、コーパスへのアノテーション付与を本格的に行った。 第9回研究会では、コーパスアノテーションの進捗状況や直面している問題について、言語班ごとに発表を行い、全員で議論を行った。年度末までに完了したアノテーション結果(マレー語、インドネシア語、タイ語は予定分をすべて完了)は、githubから公開した。 さらに、国際学会ISMILを主催し、本課題に関する発表を2件行った他、韓国翰林大学から申瑞仁教授を招へいし、「韓国語コーパス言語学の現状:コーパス構築を中心に」という公開講演会を実施した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初計画では今年度にコーパスアノテーションをすべて完了する予定であった。しかし、日本語、朝鮮語、ジャワ語、ベトナム語、ビルマ語ではそれが叶わなかった。また、タイ語以外の言語では確認作業が残ってしまった。
|
今後の研究の推進方策 |
最終年度である来年度は、未完了のコーパスアノテーション作業とその確認を終える。また、共通調査票に基づく多言語データセットについて、問題点を修正し、例文を英訳した上で、最終版を公開する。 研究会では、これらの構築した言語資源やその構築過程から得られた知見について発表・議論する。さらに、研究成果を英文図書としてまとめるために、原稿の準備を行う。
|