2012 Fiscal Year Annual Research Report
母語識別システムの開発と非母語話者日本語音声コーパスの構築
Project/Area Number |
24810034
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
網野 加苗 科学警察研究所, 法科学第四部, 研究員 (70630698)
|
Project Period (FY) |
2012-08-31 – 2014-03-31
|
Keywords | 母語識別 / 非母語話者 / 音声コーパス / 法科学 / 第二言語習得 |
Research Abstract |
来日外国人犯罪捜査において,犯人の日本語音声から母語を識別できるようなシステムを構築するため,研究用音声の収録,分析およびそれらを用いた母語識別実験を行った. 今年度は韓国語話者の音声の追加収録を行い,現在までに計74名分の音声収録を終えた.固定電話を介して録音された音声を分析対象として,日本語・中国語・韓国語・タイ語の4言語話者について実験を行った.文章の読み上げ発話について,イントネーションや発話リズムなどの韻律を中心に音響分析を行い,子音や母音を生成する速度に対応する調音速度を特徴量として抽出した.調音速度は音節の生成速度を基準とするのが普通だが,日本語のリズム特性に合わせてモーラを基準とする特徴量を提案し,母語識別実験に使用した.ロジスティック回帰分析による識別を行ったところ,72.7%という正解率を得た.この正解率は他の研究と比較して,高い値であると言える. さらに,各言語において,調音速度の値に性差が見られたため,その差を利用して,音声の性別識別を行った.日本語母語話者の発話については,発話の平均基本周波数と調音速度を合わせて用いることで,ほぼ100%の識別正解率が得られることが分かった(743発話).これらの実験結果を国内外の学会で報告し,現在学術雑誌に投稿する論文としてまとめているところである. また,昨年度行った電話番号の読み上げ発話を用いた母語識別実験について,学術雑誌に論文を投稿し,査読結果に基づいて修正・再提出を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ベトナム語母語話者の音声収録以外は,おおむね当初の計画通り順調に進展している.ベトナム語話者は,近郊の大学等に実験参加募集をかけたものの応募がなく,今年度は収録を行うことができなかった.研究計画書記載の「計画通りに進まない場合」に基づき,今年度の実験は既存の音声データベースを用いて行った.
|
Strategy for Future Research Activity |
次年度は音声の追加収録を行うと同時に,既存の音声データベースを利用して,さまざまな実験条件について検討を行う. 本研究課題において収録を行った音声資料を他の音声研究においても使えるように,資料の編集・整備を行い,公開に向けて準備を進める.
|