平成18年度に引き続き、学術場面における超級話し言葉コーパスの構築のために、データの保存方法、スクリプトの記述方法に関する基礎研究を行い、平成19年度は、スクリプトの記述方法、独話(スピーチ)と三人会話(協同学習場面)の文字化基準とタグ付けマニュアルについては、ほぼ完成することができた。 コーパスの設計と構成に関しては、社会言語科学会等で報告を行うとともに一部のデータを公開し、主に日本語教育関係者から貴重なフィードバックを得ることができた。 独話データについては、音声データと文字データがリンクする形式でデータ整備をすすめ、公開可能な水準に到達した。一方、三人会話のデータは、発話者別には音声データと文字データをリンクすることはできるものの、リンクの状態を保ったままで三人同時に表示することは現段階ではまだできない。三人の会話の文字データについても、時間順に配列して同時表示する方法は既に完成しているが、リーダビリティ(読みやすさ)の点では解決すべき問題が残る。また、三人会話における非言語行動(視線・うなづき・身体動作等)の記述方法も検討の途上にある。平成20年度には、こうした点を改善した上で、コーパスを一般公開できる水準に高めることに取り組む予定である。 また、平成19年度には、コーパス関連のシンポジウムへの参加や既に公開されているコーパスの分析により、本コーパスの公開方法を検討した。その結果、国立情報学研究所情報社会相関研究系音声メディアグループと連携し、音声資源コンソーシアムの「音声コーパスリスト」への参加方針を固めることができた。 平成20年度は、「音声コーパスリスト」への参加を前提として、音声データに含まれる個人情報の処理等、公開に向けてのコーパスの整備を進めるとともに、本コーパスを用いた協同学習に関する研究成果を発表する予定である。
|