2019 Fiscal Year Research-status Report
日本の大学生によるCBT英語スピーキングテスト回答音声データに基づくコーパス構築
Project/Area Number |
19K00849
|
Research Institution | Kyoto Institute of Technology |
Principal Investigator |
神澤 克徳 京都工芸繊維大学, 基盤科学系, 助教 (00747024)
|
Co-Investigator(Kenkyū-buntansha) |
李 在鎬 早稲田大学, 国際学術院(日本語教育研究科), 教授 (20450695)
小林 雄一郎 日本大学, 生産工学部, 助教 (00725666)
森 真幸 京都工芸繊維大学, 情報工学・人間科学系, 助教 (90528267)
光永 悠彦 名古屋大学, 教育発達科学研究科, 准教授 (70742295)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 学習者コーパス / 話しことばコーパス / CBT英語スピーキングテスト / 日本人大学生 / 外国語教育 |
Outline of Annual Research Achievements |
本研究の目的は、京都工芸繊維大学で学部1年次生全員を対象に実施したCBT英語スピーキングテスト (KIT Speaking Test) の回答音声データに基づいてコーパス (KIT Speaking Test Corpus) を構築し、公開することである。また、そのコーパスを用いて分析を行い、日本人大学生のスピーキング能力の特徴を明らかにし、英語教育や言語テストなどの分野に貢献するデータを提供することである。 本研究は、(1)データの書き起こしとタグ付け、(2)ローカル版コーパスの構築とデータ分析、(3)オンライン上でのコーパス公開という3段階に分けて行う。 2019年度はこのうち(1)を中心に行い、576名分の回答音声データのうち、335名分(約60%)の書き起こしとタグ付けを完了した。作業は研究代表者(神澤)の統括のもと、京都の大学で言語学や英語教育を専攻する大学院生4名が行った。作業にあたっては、作業者間での作業内容の差が最小限となるよう、さまざまな工夫を行った。まず、作業前には「書き起こし・タグ付けマニュアル」に基づいて入念なミーティングとトレーニングを実施した。また、研究代表者と作業者間でslackを立ち上げ、作業中は情報共有を密に行った。さらに、一部(全体の10%程度)の回答音声については、作業者全員が書き起こしとタグ付けを行い、作業者間の作業の一致率に問題がないことを確認しながら作業を進めた。2019年度に実施した(1)の作業は、今後の(2)、(3)の作業の基礎となるものであり、極めて重要である。 また、(1)の作業に加え、データ分析班(神澤、小林、李、光永)を中心に、書き起こしとタグ付けがすでに完了した約300名分のデータを用いて、分析を開始した。分析結果は、2020年度以降に学会や論文等で発表予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通り、本研究のメインとなる回答音声データの書き起こしとタグ付けを576名分中、335名分(約60%)完了した。また、書き起こしとタグ付けが完了した約300名分のデータを用いて、分析に着手した。
|
Strategy for Future Research Activity |
2020年度のなるべく早い時期に、残りの241名分の回答音声データの書き起こしとタグ付けを完了させる。その上で、データ分析班(神澤、小林、李、光永)はデータ分析と結果の考察を行う。また、コーパス公開班(神澤、森)は、オンライン上でのコーパスの公開方法を検討する。 これらの研究成果は関連分野の学会や論文等で積極的に発信する。2020年6月時点では、2020年10月に開催される英語コーパス学会に投稿予定である。
|
Causes of Carryover |
研究の進捗状況などをふまえ、2019年度に予定していた学会発表を2020年度に繰り越したため、次年度使用額が発生した。2020年度に学会発表を行い、その際の研究分担者の旅費として使用する。
|
Research Products
(11 results)