2023 Fiscal Year Annual Research Report
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
Project/Area Number |
22H00668
|
Allocation Type | Single-year Grants |
Research Institution | Osaka University |
Principal Investigator |
中俣 尚己 大阪大学, 国際教育交流センター, 准教授 (00598518)
|
Co-Investigator(Kenkyū-buntansha) |
太田 陽子 一橋大学, 森有礼高等教育国際流動化機構, 教授 (20373037)
渡部 倫子 広島大学, 人間社会科学研究科(教), 教授 (30379870)
森 篤嗣 武庫川女子大学, 教育学部, 教授 (30407209)
橋本 直幸 福岡女子大学, 国際文理学部, 准教授 (30438113)
麻 子軒 関西大学, 国際教育センター, 留学生別科特任常勤講師 (30880249)
小西 円 東京学芸大学, 大学教育研究基盤センター機構, 准教授 (60460052)
末繁 美和 岡山大学, 教育推進機構, 准教授 (60638998)
清水 由貴子 聖心女子大学, 現代教養学部, 准教授 (60735851)
澤田 浩子 筑波大学, 人文社会系, 准教授 (70379022)
建石 始 神戸女学院大学, 文学部, 教授 (70469568)
小口 悠紀子 広島大学, 人間社会科学研究科(教), 准教授 (70758268)
加藤 恵梨 愛知教育大学, 教育学部, 准教授 (70770311)
奥野 由紀子 東京都立大学, 人文科学研究科, 教授 (80361880)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | 話題 / コーパス / 例文生成 / 特徴語 / 特徴コロケーション / Can-dos / Chat-GPT / 日本語教育 |
Outline of Annual Research Achievements |
本研究は①日本語教育のための話題―単語情報サイトの構築と②『日本語話題別会話コーパスJ-TOCC』の拡充の2つの目標を立てている。 ①については、ウェブサイトの心臓部となるデータベースの仕様を確定させ、ウェブデザインについて大まかな議論を行うことができた。名称を「J-TOCC Web」と決定した。 ②については、名称を『J-TOCC on SDGs』とし、全国で会話の録音を達成した。達成率は50%でこれは2023年度の目標通りである。また、文字化についても議論を行い、ガイドラインを策定した。 その他、情報サイトに載せる情報の抽出作業として、特徴コロケーションの抽出で画期的な成果をあげることができた。また、例文についても、コーパスからの抽出に統計的手法やAIを補助的に用いる手法、さらには単語リストからのAIによる例文自動生成など手法を模索した。また、話題ごとの質的分析を進め、どのような内容が話されているかという観点からタスクを抽出した。 J-TOCCの普及事業も重要な実績である。2023年度はJ-TOCCの公式資料と活用例を収めた論文集『話題別コーパスが拓く日本語教育・日本語学』が出版された。それと同時に海外も含めて講演活動を通して普及に努めた。その結果、2023年度の1年間でおよそ100件の利用申請があった。(団体での申し込みを含むため、利用者はさらに多いと考えられる)
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
新規コーパスの作成については完全に予定通りに進めることができた。また、情報サイトについても、2024年度にすぐに制作にかかれる段階まで準備を進めることができた。この2つのメイン作業については当初計画通りの進捗と評価できる。 一方で、それ以外の当初計画になかった研究について一定の成果を出しつつある。まず、特徴コロケーション抽出については単純な方法で成果を出すことができた計量国語学会で発表することができた。また、例文抽出については模索中であるが、コーパス中の不適切な用例のフィルタリングにAIが使えるという知見が得られた。また、AIを用いた例文生成にも成功した。さらに、質的研究についても「動物」「日本の未来」「漫画・ゲーム」の3話題について研究を行うことができた。
|
Strategy for Future Research Activity |
話題―単語情報サイト「J-TOCC Web」については2024年度末に基本的な機能を備えた状態で構築し、仮公開を行う。また、新コーパス『J-TOCC on SDGs』については2024度に120ペアすべての録音を完了し、一部については文字起こしの作業を進める。 関連研究として、特徴コロケーションの抽出については、『日本語教育』への投稿を行う。最適例文自動抽出の仕組みについても研究を続け、学会での発表を行う。質的研究については複数のケースをまとめ、ワークショップの形で発表を行う。特に話題精通度との関連についての研究はユニークなので国際学会での発表を目指す。 普及活動も引き続き行い、AILA(国際応用言語学会)をはじめ、各地で講演を実施する。
|
Remarks |
本科研に関するデータは上記ウェブサイトで公開している。2024年度には「話題別日本語語彙表(短単位版)」を公開した。
|
Research Products
(13 results)