2017 Fiscal Year Research-status Report
TED Talksのスピーチ動画を利用した英日マルチメディア・コーパスの構築
Project/Area Number |
16K02778
|
Research Institution | Senshu University |
Principal Investigator |
佐藤 弘明 専修大学, 商学部, 教授 (60187226)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 大学英語教育学会基本語彙リスト / JACET8000 / TED Talks / プレゼンテーション / コーパス / YouTube / 音声・映像 |
Outline of Annual Research Achievements |
平成29年度に公開されたTED Talksの英語スピーチ約180本のデータをパソコンにダウンロードして、既に作成したデータベースに追加登録した。ダウンロードしたスピーチの英語字幕には、日本語字幕データを加えて、英文の意味の確認を容易に行える工夫をしている。平成29年度末時点において総数2,280本のスピーチをデータベースに登録した。 2,280本のスピーチの中から英語教育に適したものを16本選び出した。その16本から『大学英語教育学会基本語彙リスト 新JACET8000』(大学英語教育学会基本語改訂特別委員会 (著)、2016年)などを参照して、習得すべき語彙リストを作成し、訳語を入力した。語彙リストを効率的に作成するために、入力用のソフトウェアを大きく改良した。改良結果は、佐藤弘明(2018)「TED Talksの英日字幕データを利用した語彙リストの作成」で詳しく報告している。また、本研究費の人件費を使用して、英文科大学院生とプロの英文翻訳家を雇用し、語彙リスト作成作業に当たらせた。 『新JACET8000』は、日本人の英語学習の実状に合うように作成されてはいるが、英単語の意味や例文が掲載されていないため、教育現場では使用しにくい。この問題を解決するため、2,280本のTED Talksから『新JACET8000』に掲載されている英単語を検索して、語義、英文用例、その日本語訳を登録する作業を開始した。作業を効率的に行うために、『新JACET8000』語彙登録用のソフトウェアを開発した。これまでに、『新JACET8000』に掲載されている約400語の語義、英文用例、その日本語訳の登録を行った。全ての用例は、YouTube動画と関連付けしているため、用例が使用されている場面を音声と映像で確認することができる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
必要となるソフトウェアが効率的に開発できたため。
|
Strategy for Future Research Activity |
TED.comから平成30年度に公開される約100本の英語スピーチのデータをパソコンにダウンロードする。ダウンロードしたスピーチの英語字幕に日本語訳を加えて、データベースに追加登録する。Webブラウザーから語句検索を行い、その語句が使われている場面の動画をWebブラウザー上で再生するシステムを改良して、さらに使いやすくする。 平成29年度から『大学英語教育学会基本語彙リスト 新JACET8000』に掲載されている英単語の用例をTED Talksから検索して、語義、英文用例、その日本語訳の登録を開始した。平成30年度は、この作業をさらに進める。『大学英語教育学会基本語彙リスト 新JACET8000』には、8000語の英単語が掲載されている。平成30年度末までに、1000語の英単語の処理を終了することを目指す。 平成28年度には、TED.comからデータを効率的にダウンロードするためにプログラミング言語pythonを利用したスクリプトを作成した。しかし、TED.comでは定期的にホームページの形式を書き換えているため、その変更に合わせてスクリプトを修正する必要がある。その修正を平成30年度も続ける。
|
Causes of Carryover |
平成29年度3月分の人件費の支払いが,平成30年度4月以降となるため。
|
Research Products
(1 results)