研究課題/領域番号 |
21K11967
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 横浜市立大学 |
研究代表者 |
越仲 孝文 横浜市立大学, データサイエンス学部, 教授 (60895928)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 筆者認識 / 話者認識 / 生体認証 / 深層学習 / 大規模言語モデル / 生成AI / ディープフェイク検出 / ニューラルネットワーク / 自然言語処理 / Transformer / Speaker recognition / Authorship recognition / Adversarial attacks / Deepfake |
研究開始時の研究の概要 |
人が話した言葉や文章には、用いる語彙や言い回し、書きぶりなど、人それぞれの個性がある。本研究では言葉の個人性に着目し、話し言葉/書き言葉のテキストデータから、それを話した/書いた人物を推論する技術を開発する。近年のニューラルネットワークの手法を活用することで、音声やメッセージから個人を認証したり、AIが生成した人工的なメッセージを見つけて不正行為を防いだりすることができると期待される。
|
研究成果の概要 |
顔認証や静脈認証などと比べて実用化が進んでいない音声認識(話者認識)の技術水準向上を目指し, 音声に含まれる言語情報の活用方法について調べ, 近年の深層学習モデルの有効性を示した. 関連して, 近年目覚ましく発展する大規模言語モデルを含む生成AIと人間の識別可能性を検証した. さらに生成AIの能力や振舞いを明らかにするため, 大規模言語モデルが出力するテキストデータの品質を比較し, GPT-4のような最高水準のモデルが人間と同等以上のテキスト生成能力を持つことを示した. 画像キャプショニングモデルについても検証を行い, 最新のモデルが画像分類タスクでその能力を定量的に測定した.
|
研究成果の学術的意義や社会的意義 |
ディジタル社会の進展に伴い, ユーザの本人確認を安全かつ簡便に行う技術が求められている中で, 顔認証や静脈認証などと並んで普及が期待される音声認証の精度を改善し, より安全で便利な社会の実現に貢献する. 加えて, 近年急速に発展して社会的な注目度も高い, 大規模言語モデルなどのいわゆる生成AIの性質を明らかにすることにより, AIの社会への普及を促進し, AI技術の健全な発展に貢献する.
|