2001 Fiscal Year Annual Research Report
フォーム型Web情報サービス享受のための携帯情報端末向け音声インターフェースの開発
Project/Area Number |
13558033
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
甲斐 充彦 静岡大学, 工学部, 助教授 (60283496)
北岡 教英 豊橋技術科学大学, 工学部, 助手 (10333501)
小林 聡 豊橋技術科学大学, 工学部, 助手 (90314096)
中野 崇 シーエーアイ(株), 技術部・リーダ
伊藤 敏彦 静岡大学, 情報学部, 助手 (20313926)
|
Keywords | Web情報 / フォーム型入力 / 音声認識 / 音声インターフェース / 言い直し / 姓名音声入力 / 地名音声入力 |
Research Abstract |
一般に、ウェブブラウザを操作する場合、マウスなどによって操作可能なGraphical User Interface(GUI)が用いられる。しかし近年、インターネットの利用の拡大によって携帯端末やPDA(携帯情報端末機器)などからもアクセスすることが可能となったが、これらの環境ではマウスなどは不向きである。 先行研究においてWWWブラウザ操作システムや選択型のフォーム型情報検索サービスにおける音声入力インターフェースなどの研究が行われてきたが、フォーム入力に対しての任意文字入力インターフェースの研究はあまり行われていない。 本研究では、情報検索におけるWWWブラウザのフォーム入力に対し任意文字列の入力を行なうための音声インターフェースについて検討した。氏名入力タスクにおいて、音声入力とペンタッチのみで、多くの場合入力可能であることを示した。今後は、音節単位の高精度な認識法を開発していく。そのために、認識対象の絞り込みが有効であることから、HTMLの構造解析の高度化を進めていく。 近年、音声認識をベースとしたインターフェースを備えたシステムの実用化が進んでいる。しかし、音声認識を用いる場合、誤認識は避けられない。一般に、ユーザはシステムの誤認識に対して、同じ内容の言い直しで対処しようとすることが多い。例えば、カーナビゲーションの地名入力タスクにおいて、地名の下位階層(町名、または、市・町名)のみが誤認識してしまうという現象も少なくない。 本研究では、地名の下位階層のみの言い直しをDPマッチングに基づくワードスポッティング法によって検出する手法を提案し、検出率98.5%、棄却率90.7%の性能を得た。また、言い直し検出することによって認識率が向上することを示した。
|
-
[Publications] 押川 洋徳, 北岡 教英, 中川 聖一: "ウェブブラウザにおける任意文字列入力を目的とした音声入力インターフェース"日本音響学会春季研究発表会. 217-218 (2002)
-
[Publications] 角谷 直子, 北岡 教英, 中川 聖一: "カーナビの地名入力における誤認識時の言い直し発話の検出手法"日本音響学会春季研究発表会. 107-108 (2002)