• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

確率オートマトンに基づく曖昧検索モデルの発話テキストへの適用

研究課題

研究課題/領域番号 14780329
研究種目

若手研究(B)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関東京都立大学

研究代表者

太田 学  東京都立大学, 工学研究科・電気工学専攻, 助手 (10326019)

研究期間 (年度) 2002 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
3,400千円 (直接経費: 3,400千円)
2004年度: 1,000千円 (直接経費: 1,000千円)
2003年度: 1,000千円 (直接経費: 1,000千円)
2002年度: 1,400千円 (直接経費: 1,400千円)
キーワード曖昧検索 / 類似検索 / 確率オートマトン / HMM / SDR / OCR / 音声認識 / 文字認識
研究概要

文字認識(OCR)の生の出力テキストに対して認識誤りの存在を考慮しながら検索を行う曖昧検索手法を、音声認識(SR)の出力テキストに対して応用する方法について検討および提案した。今年度は、様々な曖昧検索手法について比較検討し、国際会議などにおける現地調査を含む関連研究の幅広い調査を行った。
1.音声曖昧検索手法の比較検討
英文発話テキストを具体的に曖昧検索する方法について検討した。文字認識と音声認識の結果の大きな違いはその認識率であり、活字文字認識率が95から99%であるのに対し、音声認識率は50から80%程度である。この認識率の差は提案する曖昧検索モデルに大きな影響を与えるため、発話テキスト検索では調整が必要となる。具体的には、認識誤りを含まない元のテキストと認識結果とのアラインメント方法、認識誤りの抽出方法、認識誤りの分類方法、確率オートマトンのパラメータの推定方法などについて、発話テキストの曖昧検索に適用可能な方法を検討した。Soundexのように類似した音節を同一のものとして扱う手法は検索精度の点で不十分で、提案手法のように認識誤りの特性を考慮する必要がある。また曖昧に検索するためのコストは検索精度とトレードオフの関係にあるが、現実的なコストで十分な検索精度を実現する必要がある。
2.調査
音声曖昧検索の研究は発表事例が少ないため、国内外の論文誌等資料を収集するとともに、最新の研究事例について国際会議などに出席して直接調査した。特にメタ検索エンジンなどのWebアプリケーションに組み込んで利用できれば有効と考えており、このような利用方法について検討した。

報告書

(3件)
  • 2004 実績報告書
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (8件)

すべて 2005 2004 その他

すべて 雑誌論文 (2件) 文献書誌 (6件)

  • [雑誌論文] 斜交基底を用いたメタ検索におけるランクリストの統合方法の提案2005

    • 著者名/発表者名
      大野 成義, 太田 学, 片山 薫, 石川 博
    • 雑誌名

      電子情報通信学会論文誌 Vol.J88-D-I, No.3

      ページ: 657-667

    • NAID

      110003207360

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Overlapping Clustering Method Using Local and Global Importance of Feature Terms at NTCIR-4 Web Task2004

    • 著者名/発表者名
      M.OHTA, H.NARITA, S.OHNO
    • 雑誌名

      Working Notes of the Fourth NTCIR Meeting Supplement volume 1

      ページ: 37-44

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] M.OHTA, A.TAKASU, J.ADACHI: "Probabilistic automaton-based fuzzy English-text retrieval"IEICE Trans.Inf.& Syst.. Vol.E86-D, No.9. 1835-1844 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] M.OHTA, H.NARITA, K.KATAYAMA, H.ISHIKAWA: "Overlapping clustering methods for a Japanese meta search engine"Proc.TASTED International Conference on Databases and Applications (DBA 2004). 100-106 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 成田 宏和, 太田 学, 片山 薫, 石川 博: "Web文書の非排他的クラスタリング手法及びその評価手法"データベースとWeb情報システムに関するシンポジウム (DBWeb2003). 85-92 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 成田 宏和, 太田 学, 片山 薫, 石川 博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"情報処理学会 データベースシステム 研究報告. 2002-DBS-128-50. 375-382 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 成田 宏和, 太田 学, 片山 薫, 石川 博: "階層的クラスタリングを利用したメタ検索エンジンの提案〜METAL〜"電子情報通信学会技術研究報告. 102・209,DE2002-61. 1-6 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 成田 宏和, 太田 学, 片山 薫, 石川 博: "Web文書検索のための非排他的クラスタリング手法の提案"第14回データ工学ワークショップ(DEWS2003). (Web). (2003)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi