• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Acceptability corpus development for investigating the difficulty of grammar acquisition in Malay/Indonesian

Research Project

Project/Area Number 23K25336
Project/Area Number (Other) 23H00639 (2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2023)
Section一般
Review Section Basic Section 02100:Foreign language education-related
Research InstitutionTokyo University of Foreign Studies

Principal Investigator

野元 裕樹  東京外国語大学, 大学院総合国際学研究院, 准教授 (10589245)

Co-Investigator(Kenkyū-buntansha) 降幡 正志  東京外国語大学, 大学院総合国際学研究院, 教授 (40323729)
塩原 朝子  東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (30313274)
稲垣 和也  南山大学, 外国語学部, 教授 (50559648)
SRI BUDILESTARI  立命館アジア太平洋大学, 言語教育センター, 講師 (80833342)
MOELJADI David  神田外語大学, 外国語学部, 講師 (60928290)
Project Period (FY) 2023-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥18,590,000 (Direct Cost: ¥14,300,000、Indirect Cost: ¥4,290,000)
Fiscal Year 2026: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Fiscal Year 2025: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2024: ¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2023: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Keywords容認性コーパス / 文法習得 / 難易度 / マレー語 / インドネシア語
Outline of Research at the Start

本研究はマレー・インドネシア語を対象とした容認性コーパスを開発し、それを用いて同言語の主要文法現象について、学習者にとっての難易度を明らかにする。容認性コーパスとは、主要文法現象の例文をその容認性とともに収集し、整理したコーパスである。
まず、他言語の容認性コーパスを参考に、マレー・インドネシア語容認性コーパスに含める文法現象を決定する。次に、複数の母語話者に対して容認性調査を行うことで、開発するコーパスにおける容認性を最終決定する。最後に、学習者に対して開発したコーパスの例文の容認性判断テストを行い、結果をコーパスの容認性と比較し一致率を見ることで、学習者にとっての難易度を解明する。

Outline of Annual Research Achievements

本研究はマレー・インドネシア語を対象とした容認性コーパス(corpus of linguistic acceptability)を開発し、それを用いて主要文法現象について、学習者にとっての難易度を明らかにする。容認性コーパスとは、主要文法現象の例文をその容認性とともに言語学の教科書などから収集し、整理したコーパスである。
初年度である本年度はメンバー全体で容認性コーパスおよびその研究開発の動向について理解を共有することと開発する容認性コーパスの大枠の設計をすることを目標として研究活動を行った。研究会を対面とオンラインで3回開催した。
第1回研究会では、コーパスに含める容認性付き例文を収集する元となる文献について全員で確認した。また、メンバーが他の科研課題で取り組んだ/取り組んでいるインドネシア語教育関連の研究について情報共有を行った。それにより、マレー・インドネシア語教育関連研究の中での本研究の位置付けが明確になった。
第2回研究会では、実際に収集し始めた例文を全員で検討した。研究会の中で検討できた例文は僅かだったものの、例文を入力するスプレッドシートの構成を確定することができたほか、例文を文法現象のカテゴリーに分類する際に生じる諸問題(対象となる文法現象の正確な把握、既存研究で使用されているカテゴリーへの分類の難しさ)や文献から収集するだけでは得られなそうな文法現象について把握することができた。また、3~4年目に母語話者と学習者に容認性調査を行う際の方法についても全体で議論した。この研究会ではメンバーが参加した多読学会の報告もあった。
第3回研究会では、引き続き例文の検討を進めたのに加え、Singapore AIのグループが2023年9月にarXivに発表した、本研究課題が開発予定のコーパスと類似のデータセットLINDSEAについて情報共有を行い、それとの差別化の方法を議論した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度の目標である、メンバー全体で容認性コーパスおよびその研究開発の動向について理解を共有することと開発する容認性コーパスの大枠の設計をすることの両方が十分に達成できた。

Strategy for Future Research Activity

Singapore AIのグループが類似の言語資源を開発し、すでに公開していることが判明したため、容認性コーパスの開発スピードを速める必要がある。
翌年度第1回研究会までに文献からの例文収集を完全に終える。研究代表者と研究補佐が中心となり、例文を文法現象のカテゴリーに分類する。メンバーで分担して例文・カテゴリーの問題点を洗い出し、研究会で議論し、最終的な例文とそのカテゴリーを確定する。
第2回研究会では、文献から収集した例文には含まれていない文法現象を洗い出し、例文を作例する。母語話者のメンバー・研究補佐が容認性を判断することで新たにデータを構築する。
第3回研究会までに、マレー語、インドネシア語両方のデータが揃うようにし(インドネシア語からマレー語、マレー語からインドネシア語の翻訳を行う)、研究会でデータの全体を最終確認する。その後、研究代表者のgithubからその段階での容認性コーパスを「試行版」として公開する。

Report

(1 results)
  • 2023 Annual Research Report
  • Research Products

    (24 results)

All 2024 2023

All Journal Article (9 results) (of which Int'l Joint Research: 2 results,  Open Access: 7 results,  Peer Reviewed: 5 results) Presentation (12 results) (of which Int'l Joint Research: 9 results,  Invited: 2 results) Book (3 results)

  • [Journal Article] Bound pronominals in West Barito languages2024

    • Author(s)
      Kazuya Inagaki
    • Journal Title

      NUSA: Linguistic studies of languages in and around Indonesia

      Volume: 76 Pages: 51-80

    • DOI

      10.15026/0002000314

    • URL

      https://tufs.repo.nii.ac.jp/records/2000314

    • Year and Date
      2024-03-31
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Issues Surrounding the Use of ChatGPT in Similar Languages: The Case of Malay and Indonesian2024

    • Author(s)
      野元裕樹
    • Journal Title

      Journal of Natural Language Processing

      Volume: 31 Issue: 1 Pages: 294-299

    • DOI

      10.5715/jnlp.31.294

    • ISSN
      1340-7619, 2185-8314
    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] Annotation of modal expressions in Indonesian2024

    • Author(s)
      Hiroki Nomoto, Jozina Vander Klok, David Moeljadi
    • Journal Title

      言語処理学会 第30回年次大会 発表論文集

      Volume: 1 Pages: 2527-2532

    • Related Report
      2023 Annual Research Report
    • Open Access / Int'l Joint Research
  • [Journal Article] A null stem analysis of Persian copular verbs2023

    • Author(s)
      Wataru Okuto, Hiroki Nomoto
    • Journal Title

      Advances in Iranian Linguistics II

      Volume: 1 Pages: 231-262

    • DOI

      10.1075/cilt.361.09oku

    • ISBN
      9789027213471, 9789027253286
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Honorific titles are D2023

    • Author(s)
      Hiroki Nomoto
    • Journal Title

      Proceedings of the Linguistic Society of America

      Volume: 8 Issue: 1 Pages: 5523-5523

    • DOI

      10.3765/plsa.v8i1.5523

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Journal Article] On the apparently non-additive use of Malay additive pun2023

    • Author(s)
      Hiroki Nomoto
    • Journal Title

      Discourse Particles in Asian Languages, Volume II: Southeast Asia

      Volume: 1 Pages: 147-172

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Issues surrounding the use of ChatGPT in similar languages: The case of Malay and Indonesian2023

    • Author(s)
      Hiroki Nomoto
    • Journal Title

      Proceedings of the 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics

      Volume: 2 Pages: 76-82

    • DOI

      10.18653/v1/2023.ijcnlp-short.9

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] NusaX: Multilingual Parallel Sentiment Dataset for 10 Indonesian Local Languages2023

    • Author(s)
      Winata Genta Indra、Aji Alham Fikri、Cahyawijaya Samuel、Mahendra Rahmad、Koto Fajri、Romadhony Ade、Kurniawan Kemal、Moeljadi David、Prasojo Radityo Eko、Fung Pascale、Baldwin Timothy、Lau Jey Han、Sennrich Rico、Ruder Sebastian
    • Journal Title

      Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics

      Volume: 1 Pages: 815-834

    • DOI

      10.18653/v1/2023.eacl-main.57

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Pengembangan bahan bacaan untuk kegiatan extensive reading di kelas Bahasa Indonesia untuk Penutur Asing2023

    • Author(s)
      Sri Budi Lestari
    • Journal Title

      インドネシア言語と文化

      Volume: 29 Pages: 35-48

    • Related Report
      2023 Annual Research Report
    • Open Access
  • [Presentation] Annotation of modal expressions in Indonesian2024

    • Author(s)
      Hiroki Nomoto, Jozina Vander Klok, David Moeljadi
    • Organizer
      言語処理学会第30回年次大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] A corpus-based study of modal strength in Indonesian2023

    • Author(s)
      Jozina Vander Klok, Hiroki Nomoto, David Moeljadi
    • Organizer
      The 26th International Symposium on Malay/Indonesian Linguistics (ISMIL)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Pro drop in Standard Malay2023

    • Author(s)
      Hiroki Nomoto, Ai Matsuura
    • Organizer
      The 26th International Symposium on Malay/Indonesian Linguistics (ISMIL)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Strong and weak neccesity modality in Indonesian2023

    • Author(s)
      Jozina Vander Klok, Hiroki Nomoto, David Moeljadi
    • Organizer
      The 10th edition of the TripleA Workshop for Semantic Fieldworkers
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] AI generatif dan bahasa Melayu2023

    • Author(s)
      Hiroki Nomoto
    • Organizer
      Persidangan Antarabangsa RENTAS Bahasa, Sastera dan Budaya Melayu 2023
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Issues surrounding the use of ChatGPT in similar languages: The case of Malay and Indonesian2023

    • Author(s)
      Hiroki Nomoto
    • Organizer
      The 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (IJCNLP-AACL 2023)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] A study of morphology of onomatopoeias in Indonesian2023

    • Author(s)
      David Moeljadi
    • Organizer
      The 26th International Symposium on Malay/Indonesian Linguistics (ISMIL)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Penyusunan Koper: Korpus Pemelajar Bahasa Indonesia Beranotasi Eror2023

    • Author(s)
      David Moeljadi
    • Organizer
      Kongres Bahasa Indonesia XII
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] エラータグ付きインドネシア語学習者コーパスの構築2023

    • Author(s)
      David Moeljadi
    • Organizer
      日本インドネシア学会第54回研究大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Strategi dan tantangan pengajaran BIPA di Jepang2023

    • Author(s)
      Masahi Furihata
    • Organizer
      Seminar Internasional INCULS 2023: "Strategi dan Tantangan Pengajaran BIPA"
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] インドネシア語の命令文における他動詞の形態についての考察2023

    • Author(s)
      原真由子, 降幡正志, 森山幹弘
    • Organizer
      日本インドネシア学会第54回研究大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Core role indexing strategies in bare stem construction in Colloquial Jakarta Indonesian2023

    • Author(s)
      Asako Shiohara, Yanti, Yuta Sakon
    • Organizer
      The 26th International Symposium on Malay/Indonesian Linguistics (ISMIL)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Book] Discourse Particles in Asian Languages, Volume I: East Asia2023

    • Author(s)
      Elin McCready, Hiroki Nomoto
    • Total Pages
      206
    • Publisher
      Routledge
    • ISBN
      9781138482432
    • Related Report
      2023 Annual Research Report
  • [Book] Discourse Particles in Asian Languages, Volume II: Southeast Asia2023

    • Author(s)
      Hiroki Nomoto, Elin McCready
    • Total Pages
      278
    • Publisher
      Routledge
    • ISBN
      9781138482449
    • Related Report
      2023 Annual Research Report
  • [Book] Language Contact between Malay and Indigenous Languages2023

    • Author(s)
      Hiroki Nomoto, Asako Shiohara
    • Total Pages
      116
    • Publisher
      Universitas Katolik Indonesia Atma Jaya and Tokyo University of Foreign Studies
    • Related Report
      2023 Annual Research Report

URL: 

Published: 2023-04-18   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi