• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

確率オートマトンに基づく曖昧検索モデルの発話テキストへの適用

Research Project

Project/Area Number 14780329
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field 情報システム学(含情報図書館学)
Research InstitutionTokyo Metropolitan University

Principal Investigator

太田 学  東京都立大学, 工学研究科・電気工学専攻, 助手 (10326019)

Project Period (FY) 2002 – 2004
Project Status Completed (Fiscal Year 2004)
Budget Amount *help
¥3,400,000 (Direct Cost: ¥3,400,000)
Fiscal Year 2004: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2003: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2002: ¥1,400,000 (Direct Cost: ¥1,400,000)
Keywords曖昧検索 / 類似検索 / 確率オートマトン / HMM / SDR / OCR / 音声認識 / 文字認識
Research Abstract

文字認識(OCR)の生の出力テキストに対して認識誤りの存在を考慮しながら検索を行う曖昧検索手法を、音声認識(SR)の出力テキストに対して応用する方法について検討および提案した。今年度は、様々な曖昧検索手法について比較検討し、国際会議などにおける現地調査を含む関連研究の幅広い調査を行った。
1.音声曖昧検索手法の比較検討
英文発話テキストを具体的に曖昧検索する方法について検討した。文字認識と音声認識の結果の大きな違いはその認識率であり、活字文字認識率が95から99%であるのに対し、音声認識率は50から80%程度である。この認識率の差は提案する曖昧検索モデルに大きな影響を与えるため、発話テキスト検索では調整が必要となる。具体的には、認識誤りを含まない元のテキストと認識結果とのアラインメント方法、認識誤りの抽出方法、認識誤りの分類方法、確率オートマトンのパラメータの推定方法などについて、発話テキストの曖昧検索に適用可能な方法を検討した。Soundexのように類似した音節を同一のものとして扱う手法は検索精度の点で不十分で、提案手法のように認識誤りの特性を考慮する必要がある。また曖昧に検索するためのコストは検索精度とトレードオフの関係にあるが、現実的なコストで十分な検索精度を実現する必要がある。
2.調査
音声曖昧検索の研究は発表事例が少ないため、国内外の論文誌等資料を収集するとともに、最新の研究事例について国際会議などに出席して直接調査した。特にメタ検索エンジンなどのWebアプリケーションに組み込んで利用できれば有効と考えており、このような利用方法について検討した。

Report

(3 results)
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • Research Products

    (8 results)

All 2005 2004 Other

All Journal Article (2 results) Publications (6 results)

  • [Journal Article] 斜交基底を用いたメタ検索におけるランクリストの統合方法の提案2005

    • Author(s)
      大野 成義, 太田 学, 片山 薫, 石川 博
    • Journal Title

      電子情報通信学会論文誌 Vol.J88-D-I, No.3

      Pages: 657-667

    • NAID

      110003207360

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Overlapping Clustering Method Using Local and Global Importance of Feature Terms at NTCIR-4 Web Task2004

    • Author(s)
      M.OHTA, H.NARITA, S.OHNO
    • Journal Title

      Working Notes of the Fourth NTCIR Meeting Supplement volume 1

      Pages: 37-44

    • Related Report
      2004 Annual Research Report
  • [Publications] M.OHTA, A.TAKASU, J.ADACHI: "Probabilistic automaton-based fuzzy English-text retrieval"IEICE Trans.Inf.& Syst.. Vol.E86-D, No.9. 1835-1844 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] M.OHTA, H.NARITA, K.KATAYAMA, H.ISHIKAWA: "Overlapping clustering methods for a Japanese meta search engine"Proc.TASTED International Conference on Databases and Applications (DBA 2004). 100-106 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "Web文書の非排他的クラスタリング手法及びその評価手法"データベースとWeb情報システムに関するシンポジウム (DBWeb2003). 85-92 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"情報処理学会 データベースシステム 研究報告. 2002-DBS-128-50. 375-382 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"電子情報通信学会技術研究報告. 102・209,DE2002-61. 1-6 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 成田 宏和, 太田 学, 片山 薫, 石川 博: "Web文書検索のための非排他的クラスタリング手法の提案"第14回データ工学ワークショップ(DEWS2003). (Web). (2003)

    • Related Report
      2002 Annual Research Report

URL: 

Published: 2002-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi