KAKEN — 研究課題をさがす | 研究者番号: 30282015

絞り込み条件

検索結果: 16件 / 研究者番号: 30282015

表示件数:

1. 画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究

研究課題

研究種目	基盤研究(B)
審査区分	小区分25030:防災工学関連
研究機関	国立研究開発法人防災科学技術研究所
研究代表者	伊勢正国立研究開発法人防災科学技術研究所, 防災情報研究部門, 主任専門研究員
研究期間 (年度)	2022-04-01 – 2025-03-31交付
キーワード	災害情報 / GIS / 音声認識 / 画像認識 / 災害対応 / ３次元都市モデル / PULATUE / 能登半島地震 / 被害把握 / 状況把握 / 情報共有 / 被害検知 / デジタルツイン / 防災情報 / AI / 被害調査 / 災害調査
研究開始時の研究の概要	本研究は、災害時において、画像認識と音声認識の複合的AI技術を活用し、一般的な自治体職員でも、円滑かつ効果的な被害状況把握を可能とするための基礎研究を行うものである。
研究実績の概要	本研究の主たる３要素であるGISデータの可視化、画像認識による被害建物の検知、音声認識による入力について、下記に示す成果を得た。
現在までの達成度 (区分)	2: おおむね順調に進展している

この課題の研究成果物	学会発表 (1件)

2. 発話中の顔画像と発話音声の高精度相互変換法の開発

研究課題

研究種目	基盤研究(C)
審査区分	小区分90150:医療福祉工学関連
研究機関	大阪工業大学
研究代表者	鈴木基之大阪工業大学, 情報科学部, 教授
研究期間 (年度)	2022-04-01 – 2026-03-31交付
キーワード	自動読話 / 音声生成 / 話者適応 / Lip2Wav / 学習済画像分類モデル / 個人性の影響 / 無発声音声対話システム / サイレント音声認識 / 読話
研究開始時の研究の概要	本研究では，顔画像を入力とし，それに対応する音声波形を出力する変換モデルを構築する。その際，入出力の特徴量として何が重要なのかを検討する。その後逆変換モデルも構築し，実際に聴覚障害者等の人々にも利用してもらうことで実用に耐える性能を持つシステムの開発を目的とする。
研究実績の概要	唇動画像から音声生成を行う深層モデルは複雑なモデル形状であるため，大規模なデータでの学習が必要となる。しかし，そうしたデータベースを準備するのは大変であり，また話者に対する汎用性の検討も必要となる。そこで今年度は，ふたつの観点から検討を行った。
現在までの達成度 (区分)	2: おおむね順調に進展している

この課題の研究成果物	雑誌論文 (1件) 学会発表 (1件)

3. 多様な歌唱入力に対応した楽曲検索システムの開発

研究課題

研究種目	基盤研究(C)
審査区分	小区分60080:データベース関連
研究機関	大阪工業大学
研究代表者	鈴木基之大阪工業大学, 情報科学部, 教授
研究期間 (年度)	2018-04-01 – 2023-03-31完了
キーワード	楽曲検索 / 歌唱音声認識 / 歌詞誤りに頑健な検索 / 歌詞の記憶誤り / Query-by-Singing / 楽曲検索システム / 検索スコアの統合 / 大語彙言語モデル / 音素系列による検索 / 歌詞認識 / 擬音語歌唱
研究成果の概要	本研究では歌唱音声を入力とした楽曲検索システムの構築を目的とし，様々な要素技術の開発を行った。まずは歌唱音声を高精度に認識する方法を開発した。歌唱は音符と音韻が対応していることから，音符の区切り時刻を利用した認識法を開発し，精度を向上させた。 ...

この課題の研究成果物	雑誌論文 (4件うち査読あり 2件、オープンアクセス 1件) 学会発表 (3件うち国際学会 1件)

4. 音楽の自動擬音語変換を用いたクラシック音楽用検索システムの開発

研究課題

研究種目	基盤研究(C)
研究分野	マルチメディア・データベース
研究機関	大阪工業大学
研究代表者	鈴木基之大阪工業大学, 情報科学部, 准教授
研究期間 (年度)	2013-04-01 – 2017-03-31完了
キーワード	楽曲検索システム / 擬音語歌唱 / 音程抽出 / 歌唱音声認識 / 歌唱音声の認識 / 擬音語自動変換
研究成果の概要	本研究では擬音語による歌唱音声から楽曲を検索するシステムの開発を行った。 ...

この課題の研究成果物	雑誌論文 (2件うち査読あり 1件、オープンアクセス 1件、謝辞記載あり 1件) 学会発表 (6件うち国際学会 3件、招待講演 1件)

5. ML-BEATS法の新たな展開

研究課題

研究種目	挑戦的萌芽研究
研究分野	知能情報学
研究機関	大阪工業大学 (2012) 徳島大学 (2011)
研究代表者	鈴木基之大阪工業大学, 情報科学部, 准教授
研究期間 (年度)	2011 – 2012完了
キーワード	知識発見とデータマイニング / 話者識別 / ML-BEATS法 / ML-BEATS / モデル化 / 時系列解析 / 音声符号化
研究概要	本研究では,音声符号化用に開発されたセグメント量子化法であるML-BEATS法を他分野に適用し,その有効性を探った。まずはML-BEATS法を一般の時系列解析法として定義し直し,時間的遷移を考慮した話者識別用モデルの構築,音声認識・合成に基づく超低ビットレート音声符号化の2分野に適用した。ML-BE ...

この課題の研究成果物	雑誌論文 (4件うち査読あり 3件) 学会発表 (6件)

6. ロボットの心の創造・開発・介護ロボットへの応用

研究課題

研究種目	基盤研究(A)
研究分野	感性情報学・ソフトコンピューティング
研究機関	徳島大学
研究代表者	任福継徳島大学, ソシオテクノサイエンス研究部, 教授
研究期間 (年度)	2010-04-01 – 2015-03-31完了
キーワード	人工知能 / 知能ロボティックス / 感性情報処理 / 情報システム / 言語理解 / 感情計算 / 心的状態遷移ネットワーク / 感情ロボット / 感情情報処理 / 心状態遷移ネットワーク / 感情コーパス / 感情分類 / 言語 / 音声 / 顔表情 / 感情認知 / ロボットの心の創造 / 心のモデル化 / 感情認識 / 感情状態 / 介護ロボット / 感情創生 / 感情表出
研究成果の概要	ロボティクス技術は飛躍的に向上し，容姿に加えてしぐさや表情まで人間そっくりなロボットも開発されている。しかし，情報の提供や定型の動作は可能であっても，相手の感情を理解し，自分自身が感情を持って動作する，といった心の部分の開発は，ほとんど行われていないのが現状である。 ...

この課題の研究成果物	雑誌論文 (25件うち査読あり 25件、謝辞記載あり 6件) 学会発表 (26件) 備考 (5件)

7. 工学的側面から心の豊かさを扱う学問体系の確立

研究課題

研究種目	挑戦的萌芽研究
研究分野	知能情報学
研究機関	徳島大学
研究代表者	任福継徳島大学, 大学院・ソシオテクノサイエンス研究部, 教授
研究期間 (年度)	2009 – 2011完了
キーワード	知的エージェント / 感性情報学 / 心豊かさ / 心的状態遷移 / 感情認識 / 感情状態 / 言語解析 / 豊心工学 / 知能科学
研究概要	豊心工学の定義、学問体系の研究を行い、工学としての心の豊かさを定義した。即ち、心の豊かさは人の命存在の価値観、そして外部からの様々な刺激に対する受ける能力を測る尺度である。ブログを収集し、タグ付けを行い、感情コーパスを構築した。この感情コーパスをもとに、感情の変化を時系列的に解析し、うつ病との関連性 ...

この課題の研究成果物	雑誌論文 (8件うち査読あり 8件) 学会発表 (25件) 備考 (3件)

8. 脳波に基づく生体情報を利用した意味的・感性的マルチメディア検索に関する研究

研究課題

研究種目	基盤研究(B)
研究分野	メディア情報学・データベース
研究機関	徳島大学
研究代表者	北研二徳島大学, ソシオテクノサイエンス研究部, 教授
研究期間 (年度)	2009-04-01 – 2014-03-31完了
キーワード	マルチメディア / 情報検索 / 脳波情報
研究概要	本研究では、画像、映像、音楽等のマルチメディア・コンテンツ検索において、脳波に基づく生体情報から得られる感性的な特徴量を用いてユーザの感性や嗜好に基づく検索を実現するための研究を行った。ユーザが未知のコンテンツを見るたびに脳波の計測を行うことは現実的に不可能であるため、正準相関分析に基づく線形回帰法 ...

この課題の研究成果物	雑誌論文 (4件うち査読あり 4件) 学会発表 (14件)

9. ML-BEATS法を用いた高効率音声符号化法の開発

研究課題

研究種目	若手研究(B)
研究分野	通信・ネットワーク工学
研究機関	徳島大学
研究代表者	鈴木基之徳島大学, 大学院・ソシオテクノサイエンス研究部, 准教授
研究期間 (年度)	2008 – 2010完了
キーワード	ML-BEATS法 / 音声符号化 / セグメント量子化 / HMM
研究概要	本研究では,ML-BEATS法を用いて音声信号中の類似区間を見つけ,それをひとつの符号として音声符号化を行うことで,極低ビットレートで品質の高い音声符号化を開発した。その際,「次元に意味を持たない」というLSPの特性を考慮してセグメント量子化を行った。従来法(G.729)と比較して,ビットレートを1 ...

この課題の研究成果物	雑誌論文 (4件うち査読あり 1件) 学会発表 (8件)

10. 日本語母語話者の英語学習のための韻律評価および文法誤り検出の高度化

研究課題

研究種目	基盤研究(B)
研究分野	外国語教育
研究機関	東北大学
研究代表者	伊藤彰則東北大学, 大学院・工学研究科, 教授
研究期間 (年度)	2008 – 2010完了
キーワード	e-ラーニング・コンピュータ支援教育 / 英語発音教育 / 外国語学習システム / 英語学習システム / 発音評価 / イントネーション / 重回帰分析 / 文法誤り検出 / 文法誤りルール / N-gram / 音声合成 / マハラノビス距離 / リズム
研究概要	コンピュータによる英語学習(CALL)システムにおいて「話す」練習を可能にするために,学習者の英語発話のイントネーション・リズムを自動評価する方法,および学習者発話に含まれる文法誤りを自動的に指摘する方法を開発した。イントネーション・リズム評価においては,決定木により単語の重要度を推定する手法を開発 ...

この課題の研究成果物	雑誌論文 (14件うち査読あり 14件) 学会発表 (10件)

11. HMnetを用いたLSP係数の極低ビットレート符号化法の開発

研究課題

研究種目	若手研究(B)
研究分野	通信・ネットワーク工学
研究機関	東北大学
研究代表者	鈴木基之東北大, 工学(系)研究科(研究院), 助手
研究期間 (年度)	2005 – 2006完了
キーワード	音声符号化 / セグメント量子化 / ML-BEATS法 / HMnet
研究概要	携帯電話やIP電話等,音声を圧縮・伝送する場合,音声データはLSP係数に変換して伝送される。LSP係数を効率よく圧縮できれば,極低ビットレートで高品質に音声を伝送することが可能となるため,従来より様々な圧縮符号化法が提案されてきた。その中で,セグメント量子化法は時間方向の類似性をよく表現できるため, ...

この課題の研究成果物	雑誌論文 (1件)

12. 話者適応と文法誤りモデリングを用いた外国語教育システムの開発

研究課題

研究種目	基盤研究(B)
研究分野	教育工学
研究機関	東北大学
研究代表者	伊藤彰則東北大学, 大学院・工学研究科, 准教授
研究期間 (年度)	2004 – 2007完了
キーワード	外国語学習システム / 発音評価 / 韻律評価 / 対話型CALLシステム / 話者適応 / 文法誤りモデル / イントネーション / リズム / 決定木 / n-gram / 誤り訂正モデル / 発音誤り検出 / 音素環境 / 機械学習 / 文法誤り検出 / SSTコーパス / CALLシステム / 音声認識 / 音素モデル / 話者適応学習 / 外国語学習 / MLLR法 / VFS法 / データベース
研究概要	1.発音評価の高精度化

この課題の研究成果物	雑誌論文 (34件うち査読あり 12件) 学会発表 (23件)

13. 離散型HMnetを用いた音声認識システム用言語モデルの自動獲得手法の開発

研究課題

研究種目	奨励研究(A)
研究分野	知能情報学
研究機関	東北大学
研究代表者	鈴木基之東北大学, 大型計算機センター, 助手
研究期間 (年度)	1999 – 2000完了
キーワード	音声認識 / 言語モデル / 離散型HMnet / NL-HMnet / 有限状態オートマトン / 状態数の自動推定
研究概要	前年度は新しい言語モデル用HMnet構成法を開発し,人工言語を用いて従来からの言語モデルとの性能比較を行った。その結果,新しく開発した言語モデル(以下,NL-HMnet)は従来からの言語モデルに比べて高い性能を持つことが確認されたが,一方で学習サンプルに対する過学習が起きやすいという欠点を持つことが ...

この課題の研究成果物	文献書誌 (5件)

14. 音声データベースからの音声知識の発見

研究課題

研究種目	特定領域研究(A)
研究機関	東北大学
研究代表者	牧野正三東北大学, 大型計算機センター, 教授
研究期間 (年度)	1999完了
キーワード	音声データベース / 話題抽出 / 韻律特徴 / 言語モデル / HMnet
研究概要	現在音声データベースからの知識発見として、以下の3つが強く期待されている。

この課題の研究成果物	文献書誌 (2件)

15. 音声データベースからの音声知識の発見

研究課題

研究種目	特定領域研究(A)
研究機関	東北大学
研究代表者	牧野正三東北大学, 大型計算機センター, 教授
研究期間 (年度)	1998完了
キーワード	音声データベース / 自動音素ラベリング / 音素モデル / 音響類似性 / HMnet / 音声要約 / 共通区間検出
研究概要	現在,マルチメディア情報のライブラリ化が急速に進められている.音声情報においてもニュースなどを自動的にライブラリ化していくことが強く望まれている.自動ライブラリ化は,発声内容が文字情報として与えられている場合とそうでない場合に分けることができる.与えられている場合には,文字情報と音声情報を対応させる ...

この課題の研究成果物	文献書誌 (6件)

16. 入力音声への適用機能を持つ連続音声認識に関する研究

研究課題

研究種目	基盤研究(B)
研究分野	知能情報学
研究機関	東北大学
研究代表者	牧野正三東北大学, 大型計算機センター, 教授
研究期間 (年度)	1995 – 1997完了
キーワード	連続音声認識 / 音素認識 / 適応機能 / 話者適応 / 発声速度 / 持続時間 / 予備認識
研究概要	音声の大きな変動要因である発生速度の変動と,個人差による変動を予備認識結果を利用して予測し,正規化するシステムの構築を目指して研究を行った.すなわち,入力音声に対してまず音素の認識を行い,その認識結果から発生速度を抽出し,それに基づいて各音素標準パターンの長さを予測する.発生速度による音素標準パター ...

この課題の研究成果物	文献書誌 (22件)