• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

潜在意味解析を利用した英語学習語彙リストの生成と評価

研究課題

研究課題/領域番号 25330417
研究種目

基盤研究(C)

研究機関津田塾大学

研究代表者

来住 伸子  津田塾大学, 学芸学部, 教授 (50245990)

研究分担者 岸 康人  神奈川大学, 付置研究所, 研究員 (50552999)
田近 裕子  津田塾大学, 学芸学部, 教授 (80188268)
久島 智津子  津田塾大学, 付置研究所, 研究員 (80623876)
研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード英語学習 / 学習コンテンツ開発支援 / 学習支援システム / 潜在意味解析 / 語彙学習
研究概要

平成25年度の予定項目3点について、次の作業を実施した。
1.語彙リスト生成の入力データとする文書集合の選定と整備。実際の英語科目 Computer Science Reading II の担当教員と相談の結果、平成25年度から電子テキスト版が存在する本を教科書にすることができた。また、研究分担者の協力により、その科目の参考サイトのリストを作成した。これにより、情報科学分野の語彙リスト生成に使用するテキストデータがほぼ確定した。また、英語科目の担当教員とは定期的に会い、どのような語彙を選んで教えているか、学生が誤解しやすい語彙は何かなどについて、聞き取り調査を行った。実際に定期試験のために英語教員が作成した問題も提供してもらい、どのような観点から問題を作成したかなどについても、興味深い知見を得た。
2. 語彙リスト生成アルゴリズムの検討。上記のテキストデータに対し、語彙頻度を集計し、Python とRでそれぞれ特異値分解を行った。その結果、Python のnumpy パッケージの特異値分解ライブラリを利用して、潜在意味解析を行うことにした。
3. 語彙リスト生成システムの環境整備。ラックサーバーを購入し、OSのインストール、ネットワーク設定、そのほかの語彙リスト生成システムを実装する環境を整備した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成25年度の実施項目3点のうち、2と3は、計画通り達成した。1は量的には6割程度の達成度だが、選定と整備の方法は確立したので、平成26年度に達成できる見込み。3点の達成度は具体的には、次のようになる。
1.語彙リスト生成の入力データとする文書集合の選定と整備。情報科学分野のテキストデータの選定と整備は順調に進んだが、もう一つの分野、情報科学以外の専門分野の文書集合の選定と整備は、実施できなかった。同時に複数分野について、聞き取り調査を進めるのは時間面で無理だった。情報科学分野のテキストデータ選定や、英語問題作成に関する知見を集める作業を通じて、英語科目の教員との協力関係は築くことができたので、今後は、より効率的に作業をすすめられる見込みである。
2. 語彙リスト生成アルゴリズムの検討。Pythonのnumpy パッケージを利用して、潜在意味解析による語彙リスト生成はできるようになったが、固有名詞やフレーズへの対応も検討する必要がわかった。固有名詞処理のための技術やアルゴリズムの検討をはじめた。
3. 語彙リスト生成システムの環境整備。計画通り実施した。

今後の研究の推進方策

平成26年度に計画している4項目を予定通り実施する。平成25年度に整備することができなかった、情報科学分野以外のテキストデータの整備も実施する。具体的には4項目について次の作業を行う。
1. 語彙リスト生成システムの実装: Pythonでnumpy ライブラリを利用した語彙リスト生成ツールを大規模データ向けに実装しなおす。また、そのツールを利用したWebアプリケーションを開発し、クラウド型サービスとして利用しやすいシステムにする。
2. 語彙リストの生成:上記のシステムを利用して、情報科学分野の語彙リストを作成する。また、情報科学分野以外のテキストデータの整備をすすめ、その分野についての語彙リスト作成を行う。
3 & 4 語彙リストの、英語教育専門家や専門分野研究者による評価および語彙に関する問題の作成: 3と4については、平成25年度に引き続き英語教育専門家と定期的に打ち合わせを実施し、段階的に、評価と問題作成作業を依頼する。

次年度の研究費の使用計画

平成25年度は情報科学分野のテキストデータ整備は実施したが、ほかの分野のテキストデータ整備に着手しなかったため、謝金等の支払いが予定より少なかった。英語教育の専門家との打ち合わせのスケジュール調整などが難しく、作業の効率が予想通りには上がらなかった。
テキストデータの整備は遅れても進めざるを得ないので、平成26年度には、より効率的に作業を実施するよう、努力する。繰り越した予算は、当初の予定通り、テキストデータの整備作業のための謝金と、該当分野の情報収集のための旅費として使用する。

  • 研究成果

    (2件)

すべて その他

すべて 備考 (2件)

  • [備考] COOLL

    • URL

      http://cooll.tsuda.ac.jp/

  • [備考] COOLL: 素材一覧 { 科目・トピック: CS Reading II }

    • URL

      http://cooll.tsuda.ac.jp/media/list/label_id/142

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi