• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

日米両国語による音声入力可能な高機能ユーザインターフェースの開発

研究課題

研究課題/領域番号 06044055
研究種目

国際学術研究

配分区分補助金
応募区分共同研究
研究機関東京大学

研究代表者

ワード ナイジェル  東京大学, 大学院・工学系研究科, 助教授 (00242008)

WARDNIGEL.G (1995)  東京大学, 工学部, 助教授

研究分担者 TAJCHMAN Gar  国際コンピュータサイエンス研究所, 音声課, 研究員
MORGAN Nelso  国際コンピュータサイエンス研究所, 音声課・カリフォーニア大学・工学部・研究員, 教授
JURAFSKY Dan  国際コンピュータサイエンス研究所, 音声課・カリフォーニア大学・工学部・研究員, 助教授
寺田 実  東京大学, 大学院・工学系研究科, 助教授 (80163921)
井上 博允  東京大学, 大学院・工学系研究科, 教授 (50111464)
DAN Jurafsky  International Computer Science Institute
NELSON Morgan  International Computer Science Institute
GARY Tajchman  International Computer Science Institute
研究期間 (年度) 1994 – 1995
研究課題ステータス 完了 (1995年度)
配分額 *注記
4,200千円 (直接経費: 4,200千円)
1995年度: 1,400千円 (直接経費: 1,400千円)
1994年度: 2,800千円 (直接経費: 2,800千円)
キーワードユーザインタフェース / 音声認識 / 音声入力 / 自然言語 / 理解 / あいづち / マルチモダル / あいずち / 音声 / ユーザー・インタフェース / ノイズ / 英語 / 日本語 / 文法
研究概要

本研究の計画に、いろいろなテーマが絡んでいた。それぞれについて述べる。
1.コネクショニスト処理
コネクショニスト音声理解は、現在、有効的である主流のアプローチとして認識されている。これについての研究はMorgan(ICSIチーム)の担当である。現在Morganは問題点をいろいろな角度から研究しており、"AVENTによる音声認識"を提案している。
2.両国語のシステム
これはブレークスルーに導く可能性がないと分かった。その代わりとして、英語と日本語のシステムを別々に構築することを考えている。
3.解析理解
ICSI側ではstochastic文脈解析を研究しており、良い結果を得られている。また統合stochastic解析も研究したが(Jurafsky担当)、こちらは予想していた結果は得られなかった。
東大側ではコネクショニストの原理をもとに、システムを構築し、評価した。パフォーマンスは非常に貧弱であった。このシステムの「理解」へのアプローチにおける問題点を中心とした論文を発表した。
4.フリー・ソフト
いくつかの改良、バグの修正、そして、拡張を加え、Lotec音声理解システムversion2を作った。
また、SLUM(the Spoken Language Understanding Mini-Challenge)を作成し、リリースした。これは、音声言語の理解、文法解析、言語モデルの開発をサポートするソフトである。これは評価するtoolのセットとちいさなコープスで作られており、音声理解システムのパフォーマンスの測定を容易にするものである。
5.マン・マシン・インタフェース
マルチモデルシステムの構成要素として音声認識を使用してみた。
1、実時間システムの制御(tetrisゲーム)
2、マウスインテンシブの制御(お絵書きtool、tgif)など。
6.音韻及びモファロジー
Jurafskyは新しい語形論、音韻論の研究をはじめた。
7.概念構造の基礎
これは、すぐ応用できる研究ではない。しかし人間の脳のなかの概念構造の数要素が明らかになった。
8.対話のやりとり
我々は「あいづち」について研究した。最大の発見は、日本語において、低調部分は「今、あいづちをうって下さい」を意味していることであった。
この結果を踏まえて、人間のあいづちを真似するプログラム"Aizula"を構築した。「うん」というあいづちしかつかないのだが、ときどきコンピュータでなく本当に人間があいづちをついているとだまされる人もいた。

報告書

(2件)
  • 1995 研究成果報告書概要
  • 1994 実績報告書
  • 研究成果

    (19件)

すべて その他

すべて 文献書誌 (19件)

  • [文献書誌] Nigel,WARD: "Using Prosodic Clucs to Decide When to Produce Back-Channel Utterances" CSLP.

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Jurafsky,Daniel: "A Probabilistic Model of Lexical and Syntactic Access and Disambiguation" Cognitive Science.

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Jurafsky,Daniel: "Universal Tendencies in the Semantics of the Diminutives : Stuructured Polysemy and the Semantic Shift from Children to Second-Order Predicates" Language.

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Gildea,Daniel and Daniel. Jurafsky: "Learning Bias and Phonological Rules Induction" Computational Linguistics.

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Gildea,Daniel and Daniel. Jurafsky: "Automatic Induction of Finite State Transducers for Simple Phonological Rules" In Proceedings of ACL95. 9-15 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Tajchman,Gary and Dan,Jurafsky and Eric Folder: "Learning Phonological Rule Probabilities from Speech Corpora with Exploratory Computational Phonology" In Proceedings of ACL95. 9-15 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Tachjman,Gary and Eric,Fosler and Dan,Jurafsky: "Building Multiple Pronunciation Models for Novel Words using Exploratory Computational Phonology" In Proceeding of EUROSPEECH-95.

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Jurafsky,Daniel Chuck,Wooters Gary,Tajchman Jonathan,Segal Andress.Stolcke Eric,Fosler and Nelson,Morgan: "Using a Stochastic Context-Free Grammer as a Language Model for Speech Recognition" In Proceedings of ICASSP-95. 189-192 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Nigel, WARD: "Using Prosodic Clucs to Decide When to Produce Back-Channel Utterances" CSLP.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Jurafsky, Daniel: "A Probabilistic Model of Lexical and Syntactic Access and Disambiguation" Cognitive Science.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Jurafsky, Daniel: "Universal Tendencies in the Semantics of the Diminutives : Structured Polysemy and the Semantic Shift from Children to Second-Order Predicates" Language.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Gildea, Daniel and Daniel.Jurafsky: "Learning Bias and Phonological Rules Induction" Computational Linguistics. (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Gildea, Daniel and Daniel.Jurafsky: "Automatic Induction of Finite State Transducers for Simple Phonological Rules" In Proceedings of ACL95. 9-15 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Tajchman, Gary and Dan, Jurafsky and Eric Folder: "Learning Phonological Rule Probabilities from Speech Corpora with Exploratory Computational Phonology" In Proceedings of ACL95. 9-15 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Tachjman, Gary and Eric Fosler and Dan, Jurafsky: "Building Multiple Pronunciation Models for Novel Words using Exploratory Computational Phonology" In Proceedings of EUROSPEECH-95.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Jurafsky, Daniel Chuck, Wooters Gary, Tajchman Jonathan, Segal Andress.Stolcke Eric, Fosler and Nelson, Morgan: "Using a Stochastic Context-Free Gramr as a Language Model for Speech Recognition" In Proceedings of ICASSP-95. 189-192 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Nigel Ward: "An Approach to Tightly-Coupled Syntactic/Semantic Processing for Speech Understanding" Proceedings of the AAAT Workshop on the Integration of Natural Language and Speech Processing. 50-57 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] Jurafsky,Daniel: "Using a stochastic contex-free grammar as a language model for speech recognition" IEEE ICASSP-95. (1995)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] Morgan,Nelson: "Modeling Dynamics in Connectionist Speech Recog-nition-The Time Index Model" International Conference on Spoken Language Processing. 3. 1523-1526 (1994)

    • 関連する報告書
      1994 実績報告書

URL: 

公開日: 1994-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi