• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声入力による公文書作成支援装置の開発

研究課題

研究課題/領域番号 07558042
研究種目

基盤研究(B)

配分区分補助金
応募区分展開研究
研究分野 知能情報学
研究機関東北大学

研究代表者

牧野 正三  東北大学, 大型計算機センター, 教授 (00089806)

研究分担者 二矢田 勝行  松下技研(株式会社), 情報ネットワーク研究所, 研究職
陳 国躍  東北大学, 大型計算機センター, 助手 (20282014)
工藤 純一  東北大学, 大型計算機センター, 助教授 (40186408)
木幡 稔  東北大学, 工学研究科, 助教授 (30186720)
研究期間 (年度) 1995 – 1997
研究課題ステータス 完了 (1997年度)
配分額 *注記
5,300千円 (直接経費: 5,300千円)
1997年度: 600千円 (直接経費: 600千円)
1996年度: 1,000千円 (直接経費: 1,000千円)
1995年度: 3,700千円 (直接経費: 3,700千円)
キーワードデイクテーションシステム / 言語モデルの獲得 / 公文書 / 音素認識 / 連続音声認識 / モデル音声法 / 言語モデル / HMnet / 文節オートマトン / 解剖所見 / 識別学習
研究概要

本研究の,音声入力による公文書作成支援装置は,公認会計士による監査報告書,医師による裁判所への解剖所見報告書,司法書士や不動産鑑定士による種々の報告書や公文書,等を音声で発声した文書を認識対象とする。これらの公文書は,一般に全体報告と個々の部分報告から構成されており,部分報告では,各部分ごとに使用される名詞や動詞の種類が限定される。公文書中に現れる語彙数は約3000〜5000語であるが,文法は比較的固定的なものである。本研究では,解剖所見文書を対象に語彙数3000語の音声入力による公文書作成支援装置を開発した。
本研究では,次の3項目について研究を行った。(1)音響類似性に基づく隠れマルコフ網を用いた高精度音素認識に関する研究,(2)識別学習に基づく高精度音素認識に関する研究,(3)音声による定型文書入力システムに関する研究
(1),(2)では,高精度音素認識システムについての研究を行った。(3)では,解剖所見報告書に代表される定型文書を音声で入力するシステムについて述べている。まず,文書の構造を表すために,ECGI法によってオートマトンを構築し,さらに出現が予測される単語への対応を強化するために,オートマトンの状態同士の距離を定義し,それに基づいてオートマトンを修正して一般化する方法を開発した。認識システムの音素認識部には,二矢田が開発したモデル音声法を用いた。以上の方法を組み合わせて解剖所見の音声入力システムを作成した。システムは,ほぼ実時間で音声を認識することができるが,認識精度は十分なものとは言えず,今後も改善を続ける。

報告書

(4件)
  • 1997 実績報告書   研究成果報告書概要
  • 1996 実績報告書
  • 1995 実績報告書
  • 研究成果

    (24件)

すべて その他

すべて 文献書誌 (24件)

  • [文献書誌] H Mori, H Aso, S Makino: "Japanese Document Recognition Based on interpolated n-gram Model of Character" Proc.of Third Inter.Conf.on Document Analysis and Recognition. 274-277 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] T.OTSUKI, A.ITO, S.MAKINO, T.OHTOMO: "The Performance Prediction on Sentence Recognition Using a Finite State Word Automaton" IEICE Trans.on Information and Systems. E79-D,6・1. 47-53 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] M.Suzuki S.Makino, H.Aso: "Acquisition of language model" Jour.Acoust.soc.America. 100, 4. 2757-2757 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] S.MAKINO, M.SUZUKI,: "Automatic Acquistion of LanguageModel using HMnet" Proc.Inter.Conf on Speech Processing. I. 47-54 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] H.Mori H.Aso S.Makino: "Japanese Document Recognition Based on interpolated ngram Model of Character" Proc.of Third Inter.Conf.on Document Analysis and Recognition. 274-277 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] T.OTSUKI,A.ITO,S.MAKINO,T.OHTOMO: "The Performance Prediction on Sentence Recognition Using a Finite State Word Automaton" IEICE Trans.on Information and Systems. E79-D,1. 47-53 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] M.Suzuki S.Makino, H.Aso: "Acquisition of language model" Jour.Acoust.Soc.America. 100,4. 2757-2757 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] S.MAKINO,M.SUZUKI,A.HARADA: "Automatic Acquistion of Language Model using HMnet" Proc.Inter.Conf on Speech Processing. I. 47-54 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] S.MAKINO.M.SUZUKI, A.HARADA: "Automatic Acquistion of Language Model using HMent" Proc.Int.Conf.Speech Processing'97. I. 47-54 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 原田, 鈴木, 牧野: "離散型HMnetによる新聞記事からの文節モデルの獲得" 電子情報通信学会技術報告. SP97・24. 45-50 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 阿部, 鈴木, 牧野, 阿曽: "音素毎の話者クラスタリングに基づく話者適応法" 電子情報通信学会技術報告. SP97・74. 41-46 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 森, 阿曽, 牧野: "再現性を考慮した文字列に基づく統計的言語モデル" 電子情報通信学会技術報告. NLC97・47. 29-34 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 鈴木,阿曽,牧野: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Y. Okimoto, S. Makino: "Phoneme Recognition using reference patterns constructed with discriminative training and DP matching" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2757-2757 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] M. Suzuki, S. Makino: "Acquisition of language models based on HMnet" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2791-2791 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 牧野 正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 伊藤,牧野: "拡張RHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] M.SUZUKI,S.MAKINO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requining No Contextual Factors" IEICE Traus, INF. & SYST.E-78-D. 662-668 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi