Project/Area Number |
23K21949
|
Project/Area Number (Other) |
22H00677 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 02100:Foreign language education-related
|
Research Institution | Kyushu University |
Principal Investigator |
内田 諭 九州大学, 言語文化研究院, 准教授 (20589254)
|
Co-Investigator(Kenkyū-buntansha) |
荒瀬 由紀 東京工業大学, 情報理工学院, 教授 (00747165)
工藤 洋路 玉川大学, 文学部, 教授 (60509173)
石井 康毅 成城大学, 社会イノベーション学部, 教授 (70530103)
ハズウェル クリストファー 九州大学, 言語文化研究院, 准教授 (90536088)
Danny Minn 北九州市立大学, 基盤教育センター, 准教授 (60382412)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥16,900,000 (Direct Cost: ¥13,000,000、Indirect Cost: ¥3,900,000)
Fiscal Year 2026: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2025: ¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
Fiscal Year 2024: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2023: ¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2022: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | コロケーション / フレーズ / チャンク / CEFR / 発信語彙 |
Outline of Research at the Start |
本研究は、コロケーション・チャンクを中心とした高頻度フレーズのCEFRレベル別のリストを作成し、公開することを目指す。日本の教育現場ではコロケーションに対する意識が低く、十分な指導が行われていない。また、日本人英語学習者に合ったレベル別のリストは存在しない。この問題点を解決するために、本研究では大規模コーパスや生成系AIなどを利用して日本人英語学習者に合ったレベル別のコロケーション・チャンクのリストを作成し、ライティング・スピーキング教育に有効な発信語彙の強化に資する教育資源を公開することを目標とする。
|
Outline of Annual Research Achievements |
本研究では、日本人英語学習者に特化したレベル別のコロケーション・チャンクリストを作成、公開することを目指す。コロケーション・チャンクの難易度は表面上の単語の難易度だけでは決まらない。特に英語と母語(日本語)のずれに起因する場合があり、広く日本の英語教育の向上に資するためには、母語の影響を考慮したリストの作成が不可欠である。また、対象となる単語を含む定形表現(チャンク)をリストアップすることは、英語学習者にとって有益であると考えられる。本目的に従って、2023年度は以下の研究を実施した。 【(1)大規模言語モデル(LLM)を用いたコロケーション・チャンクの抽出実験】プロンプトを様々な形で調整し、LLMからコロケーション・チャンクを抽出する方法を試みた。その結果、ChatGPTのAPIを通して効果的に抽出できることが明らかになった。さらに有効な手法を発見するため、次年度以降も継続的に研究を行う。 【(2)LLMベースのリストの検証】LLMから作成したコロケーション・チャンクのリストについて、大規模コーパス(COCA)を用いてその有効性を検証した。検証の結果、生成された高頻度語リストは、平均して50%程度一致することが明らかとなった。また、一致しないものに関しても多くの場合で頻度の高いものが抜き出されており、教育効果の高いものであることがわかった。この結果は、国際ジャーナルであるApplied Corpus Linguisticsに投稿し、公開されている(Uchida, 2024)。 【(3)シンポジウムの開催】2023年11月18日~19日の日程で、大分県別府市でメソドロジー研究会と共同でシンポジウムを開催した。科研のテーマに関する発表が10件以上あり、関連する研究者と最新の情報を交換することができた。今後もこのような研究会を開催できればと考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」で報告した通り、当初の計画に従って研究が進んでいる。生成系AIにより研究状況が大きく変化したが、Uchida (2024)にまとめたように、コーパスとの関係について世界的に見ても先進的な報告を行った。また、シンポジウムの開催によって研究者同士のつながりも強固になり、今後の研究体制が整ったといえる。したがって、「おおむね順調に進展している」と判断する。
|
Strategy for Future Research Activity |
今後の研究の進め方について、効果的であることが明らかになった生成系AIのさらなる利活用を視野に、関連情報を集め、応用的な研究を進めていく予定である。また、シンポジウム等の開催を行い、研究者のネットワーク拡充も行いたい。現時点の研究計画で、大きな変更は必要ないと考えている。
|