研究概要 |
本研究では、利用者の年齢層を発話から自動判別するウェブシステムの開発及び公開実験を行う。若年層に対し、安全・安心なネットサーフィン環境を提供することが目的である。本年度は、(1) 昨年度から引き続き、音声入力ウェブシステムw3voiceを応用した子ども発話の収集及び、収集発話のデータベースとしての整備・分析(2) w3voiceシステムと提案法の統合によるプロトタイプシステムの開発の二つを重点項目として実施した。(1) に関しては、合計3,053個の実環境発話サンプルの収集が完了しており、そのうち、59.7%が子どもの発話である。サンプルの音響的な分析に加え、発話内容の言語的観点からの分析を行った。その結果、子どもの場合は、キャラクターの名称等の単語のみの発話、一方、大人は、ことわざや格言、四字熟語を用いた発話を好む等の言語的な傾向の違いを確認した。また、被験者聴取の主観的評価によって、発話のみからの大人・子ども識別能力を調査し、人間の聞き分け能力と、機械学習による識別能力を比較した。そこから、大人と子どもを区分する年齢の閾値は、13歳程度が妥当であるとの結果が得られた。この他に、機械学習のアルゴリズムにSVM(Support Vector Machine)の導入を行い、実験を開始している。(2) に関しては、ウェブブラウザからの発話の入力を受け、そのユーザが大人か子どもかを判別するデモシステムを開発した。このシステムを情報処理学会全国大会(東京大学)において公開した。次年度以降、本システムを用いた提案法の評価実験及び、アルゴリズムの改良を行う。
|