1993 Fiscal Year Annual Research Report
教授資料用 音声データベースの構築と検索ツールに関する研究
Project/Area Number |
05451145
|
Research Institution | National Institute for Educational Policy Research |
Principal Investigator |
小松 幸廣 国立教育研究所, 教育情報・資料センター, 主任研究官 (50241229)
|
Co-Investigator(Kenkyū-buntansha) |
吉岡 亮衛 国立教育研究所, 教育情報・資料センター・教育情報調査室, 研究員 (40200951)
坂谷内 勝 国立教育研究所, 教育情報・資料センター・教育情報研究協力室, 研究員 (70187053)
|
Keywords | 声データベース / 音声教材 / マルチメディア / 音 |
Research Abstract |
(1)“自然の音"データの採取 音声データの対象は“自然の音"と音声辞書制作のための“ことばの発音"の収録を行っている。これらの進捗状況は次のとおりである。 ・音声に関する語句(擬声語、擬態語など)の抽出 全国シャア上位3社の現行教科書(小学校8科目、中学校14科目)を対象にして音声に関係する語句の抽出を行った。3月現在、国語、理科の教科書の計23冊、約300項目の抽出を完了した。この語句を基にして音声データの収録を進めたが、対象が動物の鳴き声など、自然条件に左右されるため30項目程度の収録件数となっている。 擬態語と擬声語の一部については、自然の音声を収録することが不可能であり、アナウンサーによる朗読を収録した。 ・音声辞書としての機能を実現するために、アナウンサーの朗読によって基礎日本語学習辞書(凡人社)の見出し語、約3000語を収録した。同音異義語、助詞、助動詞、代名詞、連体詞、接続詞など独立した発音ではイントネーションやアクセントの識別が困難な語については用例を収録した。(約500語) 収録した音声データは編集作業を行っている。編集作業では、音声レベル、量子化幅、サンプリング周波数、採取場所、時間、圧縮の有無、名称の属性を付けたうえで光磁気ディスクへの登録を行って行く予定である。 (2)音声データベース検索ツールの開発 検索ツールの機能設計を開始し、試験的なプログラムを作成するなどの取組を行った。音声データベース検索ツール設計上で配慮する点として、明らかになったことを挙げる。 ・擬声語や擬態語には類似な表現があり共通理解が得られる音声データの決定が難しい。同様に、音の呼び名は同じでも時間や場所によって実際の音が異なる。音の呼び名と一致する一般的な音の認識が確立されていない場合が多い。等の困難点がある。よって、多くの属性を付加し、様々なポインタから指せるようなデータ構造で設計する必要がある。属性の決めだし、分類項目の選定など、音声データの基本構造を検討中である。 ・音声データの検索は、音声を現す単語のみで行うことは難しい。音源をジャンルによって分類し、分類項目及び音源をイラストやアイコンで表現する方法を検討している。試験的な段階として、音声に関する語句の抽出項目を選定し、この語句の音源のジャンルを樹構造に分類した。今後、この分類による検索効率の評価を行い、より適正なものにして行く計画である。
|