2000 Fiscal Year Annual Research Report
Project/Area Number |
12680406
|
Research Institution | University of Library and Information Science |
Principal Investigator |
石川 徹也 図書館情報大学, 図書館情報学部, 教授 (20041808)
|
Co-Investigator(Kenkyū-buntansha) |
秋葉 友良 電子技術総合研究所, 知能情報部, 研究官
伊藤 克亘 電子技術総合研究所, 知能情報部, 主任研究官
藤井 敦 図書館情報大学, 図書館情報学部, 助手 (30302433)
|
Keywords | 音声認識 / 音声対話 / 情報検索 / 講演音声検索 / 言語モデル / WWWからの事典情報収集 / 言語横断検索 / 音声要約 |
Research Abstract |
本研究は,図書館情報大学(図情大)と電子技術総合研究所(電総研)の共同研究である.そこで,今年度(初年度)は,図情大と電総研に均一な計算機環境や研究資源を整備することと,音声対話に基づく情報検索システム開発のための基盤研究を中心に行った.本研究が目的とするシステム開発には,a)利用者が発話した検索要求に対する音声認識技術,b)検索要求を満足する文書情報を取得する検索技術,c)検索を円滑に進めるための音声対話技術,さらに,d)以上の処理に共通して利用する単語辞書の構築が必要である.これらのうち,今年度は,「音声認識」「情報検索」「辞書構築」の3つを中心に行った.音声認識では,認識精度を向上させるための言語モデルを半自動的に構築する手法と,辞書未登録語(未知語)の音韻系列を推定するための手法を提案した.これらによって,既存の音声認識エンジンを検索対象の分野に応じて柔軟に調整(カスタマイズ)することが容易になった.情報検索では,利用者の母国語で書かれた文書だけでなく,外国語情報を幅広く検索するための言語横断検索(cross-language information retrieval)に関する新しい手法を提案し,母国語だけを用いて高い精度で外国語文書を検索できることを実験的に示した.さらに,講演音声文書の検索・要約に関する新しい手法を提案し,文書情報だけでなく音声情報の検索を可能にした.辞書構築では,WorldWide Webから専門用語に関する事典情報を自動的に収集する手法を提案し,既存の単語辞書の網羅性を高めることに成功した.また,Webから収集した事典情報を一種の知識ベースとして利用することで,次年度以降着手する音声対話部分の性能を高めることが期待できる.
|
Research Products
(6 results)
-
[Publications] Atsushi Fujii,Tetsuya Ishikawa: "Japanese/English Cross-Language Information Retrieval : Exploration of Query Translation and Transliteration"Computers and the Humanities. (掲載予定).
-
[Publications] 藤井敦,石川徹也: "質問翻訳と文書翻訳を統合した日英言語横断情報検索"電子情報通信学会論文誌. J84-D-II,No.2. 362-369 (2001)
-
[Publications] 藤井敦,石川徹也: "音声言語データの構造化に基づく講演発表の自動要約"話し言葉の科学と工学ワークショップ講演予稿集. 173-177 (2001)
-
[Publications] T.oyosi Akiba,Katunobu Itou: "Semi-Automatic Language Model Acquisition without Large Corpora."Proceedings of 6th International Conference on Spoken Language Processing,. 4. 49-52 (2000)
-
[Publications] 伊藤克亘,速水悟,田中和世: "単語発声の複数サンプルを利用した未知語の音韻系列の推定"電子情報通信学会論文誌. J83-D-II No.11. 2152-2159 (2000)
-
[Publications] Atsushi Fujii,Tetsuya Ishikawa: "Utilizing the World Wide Wed as an Encyclopedia : Extracting Term Descriptions from Semi-Structured Texts"Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics. 488-495 (2000)