確率オートマトンに基づく曖昧検索モデルの発話テキストへの適用

Research Project

Project/Area Number	14780329
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	情報システム学(含情報図書館学)
Research Institution	Tokyo Metropolitan University
Principal Investigator	太田学東京都立大学, 工学研究科・電気工学専攻, 助手 (10326019)
Project Period (FY)	2002 – 2004
Project Status	Completed (Fiscal Year 2004)
Budget Amount *help	¥3,400,000 (Direct Cost: ¥3,400,000) Fiscal Year 2004: ¥1,000,000 (Direct Cost: ¥1,000,000) Fiscal Year 2003: ¥1,000,000 (Direct Cost: ¥1,000,000) Fiscal Year 2002: ¥1,400,000 (Direct Cost: ¥1,400,000)
Keywords	曖昧検索 / 類似検索 / 確率オートマトン / HMM / SDR / OCR / 音声認識 / 文字認識
Research Abstract	文字認識(OCR)の生の出力テキストに対して認識誤りの存在を考慮しながら検索を行う曖昧検索手法を、音声認識(SR)の出力テキストに対して応用する方法について検討および提案した。今年度は、様々な曖昧検索手法について比較検討し、国際会議などにおける現地調査を含む関連研究の幅広い調査を行った。 1.音声曖昧検索手法の比較検討英文発話テキストを具体的に曖昧検索する方法について検討した。文字認識と音声認識の結果の大きな違いはその認識率であり、活字文字認識率が95から99%であるのに対し、音声認識率は50から80%程度である。この認識率の差は提案する曖昧検索モデルに大きな影響を与えるため、発話テキスト検索では調整が必要となる。具体的には、認識誤りを含まない元のテキストと認識結果とのアラインメント方法、認識誤りの抽出方法、認識誤りの分類方法、確率オートマトンのパラメータの推定方法などについて、発話テキストの曖昧検索に適用可能な方法を検討した。Soundexのように類似した音節を同一のものとして扱う手法は検索精度の点で不十分で、提案手法のように認識誤りの特性を考慮する必要がある。また曖昧に検索するためのコストは検索精度とトレードオフの関係にあるが、現実的なコストで十分な検索精度を実現する必要がある。 2.調査音声曖昧検索の研究は発表事例が少ないため、国内外の論文誌等資料を収集するとともに、最新の研究事例について国際会議などに出席して直接調査した。特にメタ検索エンジンなどのWebアプリケーションに組み込んで利用できれば有効と考えており、このような利用方法について検討した。

Report

(3 results)

Research Products
(8 results)

All 2005 2004 Other

All Journal Article (2 results) Publications (6 results)

[Journal Article] 斜交基底を用いたメタ検索におけるランクリストの統合方法の提案2005
- Author(s)
  大野成義, 太田学, 片山薫, 石川博
- Journal Title
  
  電子情報通信学会論文誌 Vol.J88-D-I, No.3
  
  Pages: 657-667
- NAID
  110003207360
- Related Report
  2004 Annual Research Report
[Journal Article] Overlapping Clustering Method Using Local and Global Importance of Feature Terms at NTCIR-4 Web Task2004
- Author(s)
  M.OHTA, H.NARITA, S.OHNO
- Journal Title
  
  Working Notes of the Fourth NTCIR Meeting Supplement volume 1
  
  Pages: 37-44
- Related Report
  2004 Annual Research Report
[Publications] M.OHTA, A.TAKASU, J.ADACHI: "Probabilistic automaton-based fuzzy English-text retrieval"IEICE Trans.Inf.& Syst.. Vol.E86-D, No.9. 1835-1844 (2003)
- Related Report
  2003 Annual Research Report
[Publications] M.OHTA, H.NARITA, K.KATAYAMA, H.ISHIKAWA: "Overlapping clustering methods for a Japanese meta search engine"Proc.TASTED International Conference on Databases and Applications (DBA 2004). 100-106 (2004)
- Related Report
  2003 Annual Research Report
[Publications] 成田宏和, 太田学, 片山薫, 石川博: "Web文書の非排他的クラスタリング手法及びその評価手法"データベースとWeb情報システムに関するシンポジウム (DBWeb2003). 85-92 (2003)
- Related Report
  2003 Annual Research Report
[Publications] 成田宏和, 太田学, 片山薫, 石川博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"情報処理学会データベースシステム研究報告. 2002-DBS-128-50. 375-382 (2002)
- Related Report
  2002 Annual Research Report
[Publications] 成田宏和, 太田学, 片山薫, 石川博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"電子情報通信学会技術研究報告. 102・209,DE2002-61. 1-6 (2002)
- Related Report
  2002 Annual Research Report
[Publications] 成田宏和, 太田学, 片山薫, 石川博: "Web文書検索のための非排他的クラスタリング手法の提案"第14回データ工学ワークショップ(DEWS2003). (Web). (2003)
- Related Report
  2002 Annual Research Report

確率オートマトンに基づく曖昧検索モデルの発話テキストへの適用

Principal Investigator

太田 学 東京都立大学, 工学研究科・電気工学専攻, 助手 (10326019)

¥3,400,000 (Direct Cost: ¥3,400,000)

Report

Research Products

[Journal Article] 斜交基底を用いたメタ検索におけるランクリストの統合方法の提案2005

Author(s)

Journal Title

NAID

Related Report

[Journal Article] Overlapping Clustering Method Using Local and Global Importance of Feature Terms at NTCIR-4 Web Task2004

Author(s)

Journal Title

Related Report

[Publications] M.OHTA, A.TAKASU, J.ADACHI: "Probabilistic automaton-based fuzzy English-text retrieval"IEICE Trans.Inf.& Syst.. Vol.E86-D, No.9. 1835-1844 (2003)

Related Report

[Publications] M.OHTA, H.NARITA, K.KATAYAMA, H.ISHIKAWA: "Overlapping clustering methods for a Japanese meta search engine"Proc.TASTED International Conference on Databases and Applications (DBA 2004). 100-106 (2004)

Related Report

[Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "Web文書の非排他的クラスタリング手法及びその評価手法"データベースとWeb情報システムに関するシンポジウム (DBWeb2003). 85-92 (2003)

Related Report

[Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"情報処理学会 データベースシステム 研究報告. 2002-DBS-128-50. 375-382 (2002)

Related Report

[Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"電子情報通信学会技術研究報告. 102・209,DE2002-61. 1-6 (2002)

Related Report

[Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "Web文書検索のための非排他的クラスタリング手法の提案"第14回データ工学ワークショップ(DEWS2003). (Web). (2003)

Related Report

太田学東京都立大学, 工学研究科・電気工学専攻, 助手 (10326019)

[Publications] 成田宏和, 太田学, 片山薫, 石川博: "Web文書の非排他的クラスタリング手法及びその評価手法"データベースとWeb情報システムに関するシンポジウム (DBWeb2003). 85-92 (2003)

[Publications] 成田宏和, 太田学, 片山薫, 石川博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"情報処理学会データベースシステム研究報告. 2002-DBS-128-50. 375-382 (2002)

[Publications] 成田宏和, 太田学, 片山薫, 石川博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"電子情報通信学会技術研究報告. 102・209,DE2002-61. 1-6 (2002)

[Publications] 成田宏和, 太田学, 片山薫, 石川博: "Web文書検索のための非排他的クラスタリング手法の提案"第14回データ工学ワークショップ(DEWS2003). (Web). (2003)