研究課題/領域番号 |
24652120
|
研究種目 |
挑戦的萌芽研究
|
研究機関 | 神戸大学 |
研究代表者 |
石川 慎一郎 神戸大学, 国際コミュニケーションセンター, 准教授 (90320994)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 音声コーパス / 学習者 / 中間言語 |
研究概要 |
【研究の目標】本研究は,筆者が別に進めているアジア圏英語学習者統制発話コーパス開発プロジェクト(ICNALE_Spoken)と有機的に連動しつつ,小規模な試行実験を通して,学習者の音声データ収集およびテキスト化にかかる問題点を整理し,システム開発の参考としうる基礎データを収集することを主たる目的としています。研究の推進にあたっては,言語教育学・英語学・日本語学・心理言語学・統計学・音声学をはじめとする関連分野の知見を統合しつつ,広く学際的観点から問題へのアプローチを行います。 【進捗と成果】1)平成24年度中に,統制環境における音声データ収集プロトコル(Version 201212)を開発しました。2)当該プロトコルにより,17名の被験者からサンプルデータを取得しました。3) サンプルデータの音声変換に使用できるソフトウェアの比較と考察を行いました。4)一部のサンプルデータにつき,実際に音声変換を実行しました。5)並走するプロジェクトの成果を含め,年度内に,単著書1冊,共著書4冊,論文6本(うち査読つき1本)を公刊しました。また,英国・米国・マレーシアを含め,内外の学会で14本の関連発表・講演を行いました(うち招待講演4本)。 【事業の意義】1)学習者音声コーパス構築にかかる作業上の問題点の整理 2)統制環境での音声データ収集の諸問題の特定と対策指針の考察 3)音声データの書き起こしにかかる諸問題の特定と対策指針の考察 4)予備データの分析に基づく音声コーパス開発計画の策定
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成24年度は,データ収集プロトコルの策定および,試行的コーパスデータの収集(第1次)を行った。年度内のおもな進捗は下記のとおりである。 ●データ収集プロトコル策定:インタビューのルール決定し,パワーポイントによるプロンプトの統制的呈示システムの試行版を開発した。 ●サンプルデータ収集:日本人大学生20名を被験者とし,上記プロトコルによるサンプルデータの収集を行った。3名は規準に合致する言語産出ができなかったので,最終的に17件のデータを得た。 ●音声変換処理システムの検討:各種の音声合成ソフトウェアを比較し,本研究に使用できるソフトウェアの選定を行い,実際に3件のデータの変換を行った。
|
今後の研究の推進方策 |
平成25年度は,収集したコーパスデータの音声変換,および,テキスト変換を実施し,関連する諸問題の特定を目指す。得られた成果は,筆者が別に進めるコーパス開発プロジェクトに有機的・即時的にフィードバックされる予定である。 ●データ収集プロトコル収集:被験者への聞き取りをふまえ,既存のインタビューのルール修正し,あわせてプロンプトの統制的呈示システムの改善を行う。 ●サンプルデータの音声変換処理収集:すでに収集したデータに対して,音声変換を行う。 ●テキスト化処理:音声変換処理済みの音声ファイルを実際にテキスト化し,その問題点,コストなどを特定し,将来の大規模テキスト変換システム開発に資する基礎データの収集を目指す。
|
次年度の研究費の使用計画 |
上記をふまえ,主として下記の目的で経費執行する予定である。 ●データ収集プロトコル収集:被験者への聞き取り作業に対する謝金,プロンプト呈示システム開発に対する謝金 ●サンプルデータの音声変換処理収集:音声変換処理作業補助にかかる謝金 ●テキスト化処理:業者によるテキスト変換作業発注委託経費 ●学会発表・図書購入:研究内容の公開のための内外学会への参加費および当該研究を実施するための参考図書・資料などの購入費
|