研究課題/領域番号 |
16K02778
|
研究機関 | 専修大学 |
研究代表者 |
佐藤 弘明 専修大学, 商学部, 教授 (60187226)
|
研究期間 (年度) |
2016-04-01 – 2021-03-31
|
キーワード | TED Talks / コーパス / スピーチ / 動画 |
研究実績の概要 |
平成28年度に公開されたTED Talksの英語スピーチ約300本のデータをパソコンにダウンロードして、既に作成したデータに追加登録を完了した。ダウンロードしたスピーチの英語字幕には、日本語訳を加えてデータベースに登録した。平成28年度末時点において2,100本のスピーチを登録した。そのデータをWebブラウザーから検索して、その語句が使われている場面の動画をWebブラウザー上で再生するシステムを2016年9月10日から公開した。ソフトウェアの解説書を作成して公開した。本研究の目的を論じた研究論文「TEDビデオを利用した英日マルチメディア・コーパスの構築」を発表した。 開発した検索システムを利用して、2,100本のスピーチの中から英語教育に適したものを10本選び出した。『大学英語教育学会基本語彙リスト 新JACET8000』などを参照して、習得すべき語彙リストを作成した。さらに、その語彙リストを利用して、英語学習者の語彙力を測定するソフトウェアを開発した。開発した語彙力ソフトウェアを実際の英語教育の現場で使用して、その報告書「各学生の学力に合わせた英語試験の実施」を発表した。 TED.comでは字幕データ等を簡単にダウンロードするための機能が公開されていたが、その公開が2016年7月15日に終了してしまった。7月15日以降に公開されたデータを効率的にダウンロードするために、プログラミング言語pythonを利用したスクリプトを作成した。このスクリプトによって、7月15日以降に公開されたデータも順次ダウンロードして、本研究で開発を進めているコーパスに追加登録できた。 国際学会LREC2016に参加して(開催期間:2016年5月23日~27日)、最新の言語資料とその処理方法に関する情報を収集した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
必要となるソフトウェアが効率的に開発できたため。
|
今後の研究の推進方策 |
TED.comから平成29年度に公開される約100本の英語スピーチのデータをパソコンにダウンロードする。ダウンロードしたスピーチの英語字幕に日本語訳を加えて、データベースに追加登録する。Webブラウザーから語句検索を行い、その語句が使われている場面の動画をWebブラウザー上で再生するシステムを改良して、さらに使いやすくする。『大学英語教育学会基本語リスト』などを参照して、ダウンロードした英語スピーチの語彙分析を行う。 開発した検索システムを利用して、2,200本のスピーチの中から英語教育に適したものを新たに10本選び出す。10本のスピーチに関して、『大学英語教育学会基本語彙リスト 新JACET8000』などを参照して、習得すべき語彙リストを作成する。さらに、その語彙リストを利用して、英語学習者の語彙力を測定するソフトウェアを改良する。語彙力ソフトウェアを実際の英語教育の現場で使用して、その教育効果を測定する。 平成28年度には,TED.comからデータを効率的にダウンロードするためにプログラミング言語pythonを利用したスクリプトを作成した。しかし,TED.comでは定期的にホームページの形式を書き換えているため,その変更に合わせてスクリプトを修正する必要がある。その修正を平成29年度も続ける。
|
次年度使用額が生じた理由 |
本研究費で購入予定であったパソコンの購入を見送り,別予算で購入済みの古いパソコンを使用し続けたため。
|
次年度使用額の使用計画 |
処理能力の高い新しいパソコンを購入する。
|