2022 Fiscal Year Annual Research Report
「話題から始まる日本語教育」を支援する情報サイトの構築と話題別会話コーパスの拡充
Project/Area Number |
22H00668
|
Allocation Type | Single-year Grants |
Research Institution | Osaka University |
Principal Investigator |
中俣 尚己 大阪大学, 国際教育交流センター, 准教授 (00598518)
|
Co-Investigator(Kenkyū-buntansha) |
太田 陽子 一橋大学, 森有礼高等教育国際流動化機構, 教授 (20373037)
渡部 倫子 広島大学, 人間社会科学研究科(教), 教授 (30379870)
森 篤嗣 京都外国語大学, 外国語学部, 教授 (30407209)
橋本 直幸 福岡女子大学, 国際文理学部, 准教授 (30438113)
小西 円 東京学芸大学, 留学生センター, 准教授 (60460052)
末繁 美和 岡山大学, 教育推進機構, 准教授 (60638998)
清水 由貴子 聖心女子大学, 現代教養学部, 講師 (60735851)
澤田 浩子 筑波大学, 人文社会系, 准教授 (70379022)
建石 始 神戸女学院大学, 文学部, 教授 (70469568)
小口 悠紀子 広島大学, 人間社会科学研究科(教), 准教授 (70758268)
加藤 恵梨 愛知教育大学, 教育学部, 准教授 (70770311)
奥野 由紀子 東京都立大学, 人文科学研究科, 教授 (80361880)
麻 子軒 関西大学, 国際教育センター, 留学生別科特任常勤講師 (30880249)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | 話題 / コーパス / 情報サイト / 指標 / 雑談のCan-Do化 / 教材作成 / 例文 |
Outline of Annual Research Achievements |
本プロジェクトのゴールは『日本語話題別会話コーパス:J-TOCC』から得られる語と話題の関係についての情報をより効率よく提供するための情報サイト作りである。本年度はそれに向けて、まず『日本語話題別会話コーパスJ-TOCC語彙表』を作成し、2022年8月に一般公開した。 本年度は情報サイトに乗せるべき情報の整理を行った。そのために、他の研究者と協働し、難易度情報や例文などの情報を情報サイトで利用する協力をとりつけることができた。また、話題別特徴語の指標として従来使われている対数尤度比(LLR)に加えて、何%の話者がその環境でその語を使用したかという話者使用率(UR)を併用するというアイディアを提案した。 もう一つの柱である話題別コーパスの拡張についても議論を行い、予備調査も行った。その結果、SDGsから16話題を選び、240名120ペアというJ-TOCC第一期と同規模のコーパスを2023-2025年度で構築することが決定した。また、話者に関する情報として話題精通度に加え、語彙数推定テストの結果も収集することを決定した。 J-TOCCの周知・宣伝にも力を入れ、各種研究会・講演でJ-TOCCの紹介を行った。そのおかげで、2022年度も安定して新規利用の申し込みがあった。また、2022年10月にはJ-TOCCのデータを用いた話題別単語帳の第2弾を出版した。さらに、話題別コーパスからどのように話題別単語帳を作っているかという裏事情を記した研究ノートを紀要に発表した。 さらに、2022年度は1つの話題の会話に質的にコーディングをほどこすことで、例えば「食べること」という話題の中で、具体的にはどのような内容が話されているのかという分析を行った。これは雑談のCan-Do化ならびに難易度判定につながる可能性を持った研究である。2023年度以降も同様の研究を継続する。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
新たな研究分担者の協力により、迅速に語彙表を作成、公開することができた。 これによって生まれた余剰時間でJ-TOCCを形態素解析情報をベースにして検索できるプロプラムを構築することができ、これを情報サイトの機能として付け加えることが決定した。これは計画にはなかったことである。 また、1つの話題を質的に見るという研究も当初計画にはなかったが、実施した結果、予想以上に興味深い結果が得らた。網羅的に行うことは難しいが、いくつかの話題についてはこの成果も情報サイトに盛り込むことができると考えられる。
|
Strategy for Future Research Activity |
まず、情報サイトの構築については、本年度中にコアとなるデータベースの構築を行う。また、後半には業者にコンタクトを取り、見積もりなどをとる予定である(サイト構築は次年度)。 次に、新規コーパス構築については、最終的には120ペアの会話を録音することを目指すが、2022年度はそのうち60ペアの録音を目標とする。8か所で録音を行うため、十分に達成可能な目標といえる。 さらに、雑談のCan-Do化を目指した、1つの話題を深く分析する質的研究についても、2023年度は3~4の話題を選んで実施する。 J-TOCC並びに本プロジェクトの宣伝を積極的に行う。その一環として、N1向けの話題別単語帳を出版する。
|
Research Products
(11 results)