2011 Fiscal Year Research-status Report
英語の高頻度POSグラムおよびフレーズフレーム表現における韻律パターン認識の分析
Project/Area Number |
23720282
|
Research Institution | Nagoya University |
Principal Investigator |
村尾 玲美 名古屋大学, 国際言語文化研究科, 准教授 (80454122)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 英語教育 / 第二言語習得 / テスト開発 / 音声言語認識 / プロソディ |
Research Abstract |
本研究の目的は1)高頻度の品詞の連なりが韻律的なパターンとして学習者の心的辞書に実在性を持つか否かを評価する音声認識テストを完成させることと、2)テストにより収集されたデータを分析し、学習者の心的辞書における韻律表象の形成とリスニング能力との関連を明らかにすることである。当初の計画どおり平成23年度は1)の作業を行い、平成24年度からはデータ収集を開始する。音声認識テストの作成にあたり、第一にテスト項目の選定を行うため、英語学習者コーパス(NICE-NNS)と英語母語話者コーパス(NICE-NS)から5つの品詞の連なりを高頻度順に抽出した。NNS・NSともに高頻度の連なり、NNSのみ高頻度の連なり、NSのみ高頻度の連なり、NNS・NSともに低頻度の連なりの4種類に分類し、分類ごとに具体的な表現を12個ずつ用意した。第二に、用意した合計48個の表現を英語母語話者の音声で録音し、録音したファイルをローパスフィルタで加工して音素情報を劣化させた。第三に、韻律のパターンマッチング課題を作成するため、テスト項目と同じ品詞の連なりから成る選択肢と異なる品詞の連なりから成る錯乱肢をコーパスに基づいて用意した。第四に、プログラム開発業者と打ち合わせを行い、韻律パターンマッチング課題48題をオンラインで受験できるシステムを開発した。このシステムではオンライン上で受験者の回答、音声再生回数、解答時間のログが確認できる。この度作成したテストの特徴は、音素情報を劣化させたテスト項目(例:as a way of life)と正解の選択肢(例:in a court of law)は品詞の並びは同じであるが、個々の語は異なるという点である。錯乱肢(例:a great deal of time)との違いを、個々の単語の違いではなく、品詞の連なりが持つ韻律の違いとして認識させるためである。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
平成23年度の研究計画では1)テスト項目の選定、2)音声の録音と加工、3)オンライン型音声認識テストの開発、4)パイロットテストおよびプログラムの修正、の4段階を設定し、平成24年度からデータ収集およびデータ解析を行う計画であった。当初の計画どおり、オンライン型音声認識テストの開発までは順調に進んだが、パイロットテストは平成23年度以内に行うことができず、平成24年度に行うことになった。計画がやや遅れている理由は主に二つある。第一に、学習者コーパスと母語話者コーパスから品詞の連なりを頻度順に抽出するまではテキスト処理が順調に行われたが、品詞の連なりに対応する具体的な表現を抽出するためのPerlスクリプトを書くのに時間を要したためである。テキスト処理に関しては最終的に早稲田大学大学院国際情報通信研究センターの研究員に専門的知識の提供を依頼し、解決した。第二に、大学から個人向けに提供されているウェブサーバではCGIプログラムの設置が禁止されているため、プロラムを運用するサーバの決定と確保に時間がかかったためである。業者の提供する有料レンタルサーバを利用してCGIを設置する方法とMac OS Xのウェブ共有機能を使ってCGIプログラムを公開する方法を検討し、安全性の観点から後者を使用することに決定した。パイロットテストの実施までには至らなかったものの、平成23年度の目的であるオンライン型音声認識テストの完成は達成されたため、このまま継続して平成24年度の目的であるデータ収集とデータ分析を遂行する予定である。
|
Strategy for Future Research Activity |
平成24年度は、前年度中に実行できなかったパイロットテストの実施とテスト項目の精査およびプログラムの修正から研究を開始する。パイロットテストでは、英語母語話者5名と英語圏からの帰国子女3名にテスト受験を依頼し、得られたデータから、正答率と音声再生回数と回答時間の平均を分析する。正答率が低い項目および、音声再生回数が多く回答時間の長い項目についてはテストから削除し、原因を検討した上で他の項目に置き換える。 パイロットテストを経てテスト項目とプログラムの修正を行った後、英語学習者からのデータ収集を開始する。名古屋大学の英語コミュニケーションの授業を受講している学生に英語音声の聞き取りとプロソディの認識の関係について説明したあと、教育の一環として「オンライン型英語音声認識テスト」の受験を授業外で行わせる。データ収集は学部生3クラス分と大学院生の合計70名ほどを予定している。 得られたデータから、日本人英語学習者が英語音声を聞き取るにあたり、プロソディ情報をいかに利用しているかについて、POSグラム表現を認識する能力の分析を行う。分析方法は二種類である。第一に、オンライン型英語音声認識テストの点数(プロソディ利用能力)とリスニング問題の点数(リスニング能力)の相関分析を行う。リスニング問題とは、名古屋大学の学生が英語の課題授業として行っている「ぎゅっとe」というリスニング課題1440題のことであり、正答率から学習者の総合的なリスニング能力を把握する。第二に、音声認識テストの項目別難易度の分析を行う。具体的には、英語母語話者コーパスに高頻度で出現するが学習者コーパスには出現しない表現と、両コーパスに出現する表現との間に正答率、音声再生回数、回答時間の差がないかどうか、また、特定の表現パターンのみ認識率が低くなっていないかについて分析する。
|
Expenditure Plans for the Next FY Research Funding |
当初の研究計画では平成23年度に英語母語話者および英語圏からの帰国子女に対してパイロットテストを行う予定であった。諸々の事情によりパイロットテストの実施が平成23年度内に終わらず、平成24年度に行うこととなったため、次年度使用額である39285円については、パイロットテストの受験者への謝礼として予定どおり使用する。平成24年度に請求する研究費は主に、データ収集のための謝礼、プログラム修正のための開発費、海外学会発表のための渡航費、論文執筆のための英文校閲費等に使用する予定である。
|