• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Inductive re-construction of Japanese grammar and its application to Japanese language education based on the large scale extraction of Japanese formulaic sequences and its structural analyses

Research Project

Project/Area Number 20H00096
Research InstitutionTokyo University of Foreign Studies

Principal Investigator

芝野 耕司  東京外国語大学, その他部局等, 名誉教授 (50216024)

Co-Investigator(Kenkyū-buntansha) 佐野 洋  東京外国語大学, 大学院総合国際学研究院, 教授 (30282776)
中村 美奈子  お茶の水女子大学, 基幹研究院, 准教授 (20345408)
望月 源  東京外国語大学, 大学院総合国際学研究院, 准教授 (70313707)
大津 友美  東京外国語大学, 大学院国際日本学研究院, 准教授 (20437073)
藤森 弘子  帝京大学, 外国語学部, 教授 (50282778)
鈴木 美加  東京外国語大学, 大学院国際日本学研究院, 教授 (90226556)
Project Period (FY) 2020-04-01 – 2025-03-31
Keywordsコーパス言語学 / N-gram分析 / 日本語定形表現 / Formulaic Sequence」
Outline of Annual Research Achievements

15億語以上の大規模話し言葉コーパスを構築するとともに、日本語話し言葉における定形表現の自動抽出を、N-gramを、一文から単語単位で全N-gramを生成し、その文脈を行IDリストとして扱う独自の統合文脈単語N-gram分析をMapReduceで実現した。この独自分析法をリスト抽象化及び文字単位に拡張し、統合文脈文字N-gram分析及び隣接行列による構造分析によって、実際の言語運用に基盤を置く帰納的日本語究へと革新するとともに、この帰納的日本語理解をもとにした大規模コーパスからの日本語教材開発を目指した。
システム・評価班では,MapReduceを用いた統合文脈N-gram分析にリスト抽象化を組み込むことによって、ビッグデータ処理のためのシステム構築を行うとともに、アイデア段階であるリスト抽象化の実証を行った。また、定形表現の抽出では同一文脈に関しては最長表現を取り出す処理を行っていることから、特定の定形表現をより短い定形表現を最長一致法で分割することにより、複合定形表現と含まれる定形表現が存在しない原子定形表現とに分析した(定形表現分析)。また、定形表現の前後の連接頻度からなる定形表現隣接頻度行列を生成した。
日本語教育班では,システム・評価班が生成する基礎データである定形表現分析及び定形表現隣接頻度行列の基礎データをKey phraseとしての検討を行った。また、教材素材取り出しシステムを利用して、検証用日本語教材の開発を行った。
【問い1】昨年度はRubyからPythonへ変更を行った。今年度は、従来の単語単位から、文字単位へ統合文脈N-gram分析を拡張した。【問い2】昨年度の定形表現分割の一つずつの定形表現を中に含まれるより短い単位への分割を行い構造分析につなげた。【問い3】については、海外での日本語教育におけるニーズ調査を行う。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

システム・評価班では,MapReduceを用いた統合文脈N-gram分析にリスト抽象化を組み込むことによって、ビッグデータ処理のためのシステム構築を行うとともに、アイデア段階であるリスト抽象化の実証を行った。また、定形表現をもとにした帰納的文法研究のため、特定の定形表現をより短い定形表現を最長一致法で分割することにより、複合定形表現と含まれる定形表現が存在しない原子定形表現とに分析した(定形表現分析)。また、定形表現隣接頻度行列を生成した。同時に教材の素材となる特定の表現の存在行の前後指定した行数を取り出す教材素材取り出しシステムを開発した。
日本語教育班では,システム・評価班が生成する基礎データである定形表現分析及び定形表現隣接頻度行列の基礎データをKey phraseとしての検討を行った。また、教材素材取り出しシステムを利用して、検証用日本語教材の開発を行った。【問い1】問い1は、基本的にはシステム開発を行いアイデアを実証した。【問い2】活用のない“名詞”、活用がなく、文法機能だけを担う“助詞・助動詞”、語尾が活用する“動詞”及び“形容詞”などの基本的な品詞の同定及びその隣接条件を明らかにした。【問い3】CEFR Aレベルの検証教材の開発を行う。また、JPLANGで実装済みの現行日本語教材との比較検証を行う。また、JPLANGを利用している海外の大学の日本語学科との共同研究も検討する。
【問い1】今年度は、従来の単語単位から、文字単位へ統合文脈N-gram分析を拡張した。【問い2】昨年度の定形表現分割の一つずつの定形表現を中に含まれるより短い単位への分割を行い構造分析につなげた。【問い3】については、海外での日本語教育におけるニーズ調査を行う予定であったが、コロナ禍のため実施できなかった。

Strategy for Future Research Activity

コロナ禍のため海外の研究機関との共同研究ができなかったので、今後はこの点を中心に推進する。

  • Research Products

    (13 results)

All 2023 2022

All Journal Article (7 results) (of which Peer Reviewed: 6 results) Presentation (6 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] 『漫才ワークショップ』による学生の学び ―言語を相対的に捉えるネタ作りと即興創作体験―2023

    • Author(s)
      Mika Suzuki, Manabu Shimaoka
    • Journal Title

      Proceedings on The International Symposium on Japanese Language Education: Rediscovering Japanese - Japanese Language Education in the Spotlight 2022

      Volume: 2022 Pages: 48-59

    • Peer Reviewed
  • [Journal Article] Can-do記述を用いた言語能力自己評価アンケートの結果-英語・日本語科目履修者の比較2023

    • Author(s)
      岡葉子、古川嘉子、藤森弘子、初鹿野阿れ
    • Journal Title

      帝京大学国際日本学研究

      Volume: 1 Pages: 34-47

    • Peer Reviewed
  • [Journal Article] 身近なメディアとコミュニケーションを再発見する機会の提供を 意図した学部言語科目での実践―日本語母語・非母語学生の『メディア・リテラシー』の涵養を意図して―2023

    • Author(s)
      鈴木美加
    • Journal Title

      日本教育メディア学会研究会論集

      Volume: 2023 Pages: 83-88

    • Peer Reviewed
  • [Journal Article] SQLおよびSQL/MMにおける日本からのいくつかの提案とその顛末2022

    • Author(s)
      小寺 孝、鈴木健司、梶野智行、土田正士、山平耕作、芝野耕司
    • Journal Title

      情報処理

      Volume: 63 Pages: 12-27

    • Peer Reviewed
  • [Journal Article] 2つの認知過程-量化と関係化の意味を対照させる言語学習2022

    • Author(s)
      佐野洋
    • Journal Title

      電子情報通信学会思考と言語研究会

      Volume: TL2022-40 Pages: 36-41

  • [Journal Article] 日本語教師と高校教員の「連絡帳」を用いた異分野間コミュニケーションー外国人高校生への日本語学習支援のための連携体制構築をめざしてー2022

    • Author(s)
      大津友美、浜田かおり
    • Journal Title

      東京外国語大学論集

      Volume: 104 Pages: 97-112

    • Peer Reviewed
  • [Journal Article] Mining Formulaic Sequences from a Spoken Japanese Based on Consolidated Contextualized N-gram Analyses and Its Verification with Key Phrases in Japanese Language Textbooks2022

    • Author(s)
      Hajime Mochizuki and Kohji Shibano
    • Journal Title

      Proceeding of World Conference On Educational Media and Technology + INNOVATE LEARNING 2022

      Volume: 2022 Pages: 909-916

    • Peer Reviewed
  • [Presentation] Extracting Japanese Sentence-Ending Expressions using Formulaic Sequences with Consolidated Contextualized N-gram Analysis2023

    • Author(s)
      Hajime Mochizuki and Kohji Shibano
    • Organizer
      The 21 st Annual Conference of Hawaii International Conference on Education
    • Int'l Joint Research
  • [Presentation] ノダ文をめぐる日中対照研究 ―外国語教育への応用を目指して―2023

    • Author(s)
      高 甜、佐野洋
    • Organizer
      東アジア言語文化学会
  • [Presentation] 中日対訳コーパスの開発とその利用-中国語「会」、日本語「のだ」の対照分析-2023

    • Author(s)
      高橋秀斗、高甜、佐野洋
    • Organizer
      英語コーパス学会語彙研究会
  • [Presentation] Real Word Statistics and End of Sentence Expressions in Japanese Closed Caption TV Corpus2022

    • Author(s)
      Hajime Mochizuki
    • Organizer
      9th International Conference on Language, Literature and Linguistics (LLL2022), Singapore
    • Int'l Joint Research
  • [Presentation] Investigation of Formulaic Sequences at The End of Sentence in Japanese Closed Caption TV Corpus2022

    • Author(s)
      Hajime Mochizuki and Kohji Shibano
    • Organizer
      2023 STEM/STEAM and Education Conference
    • Int'l Joint Research
  • [Presentation] 日中対訳小説からみる文末名詞文の使用と説明のメカニズム―ノダ文と中心に―2022

    • Author(s)
      高 甜,佐野洋
    • Organizer
      第26回外国語教育学会大会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi