従来の学習者発話コーパス開発では,発話を書き起こしたトランスクリプトは公開されるものの,学習者の匿名性の確保の観点から,音声データそのものの公開はほとんどなされていなかった。音声データの公開を可能にするには,発話者の特定を回避するための音声変換が必要になる。そこで,様々な変換パラメタを実験し,発話者の性別ごとに,発話者が特定されず,かつ,音声として懲戒可能となるパラメタ候補を特定した。あわせて,当該処理を施した試行データを公開した。また,音声データとテキストデータをリンクして検索できるシステムのありかたについて基礎的な調査と分析を行った。
|