研究課題/領域番号 |
21K11967
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 横浜市立大学 |
研究代表者 |
越仲 孝文 横浜市立大学, データサイエンス学部, 教授 (60895928)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 深層学習 / ニューラルネットワーク / 自然言語処理 / 生体認証 / 生成AI / Transformer / Speaker recognition / Authorship recognition / Adversarial attacks / Deepfake |
研究開始時の研究の概要 |
人が話した言葉や文章には、用いる語彙や言い回し、書きぶりなど、人それぞれの個性がある。本研究では言葉の個人性に着目し、話し言葉/書き言葉のテキストデータから、それを話した/書いた人物を推論する技術を開発する。近年のニューラルネットワークの手法を活用することで、音声やメッセージから個人を認証したり、AIが生成した人工的なメッセージを見つけて不正行為を防いだりすることができると期待される。
|
研究実績の概要 |
本研究では、音声に含まれる個人性のうち、これまであまり研究されてこなかった言語的な個人性、すなわちテキスト情報に現れる書き手の特徴について明らかにする。研究成果は、音声通話やネット投稿のなりすましのような犯罪の防止、さらには近年著しい進歩を見せている生成AIの悪用防止に有用である。 当年度は、深層ニューラルネットワークに基づくテキスト分類モデルを構築し、その精度向上を図った。とりわけ、近年その有効性が広く知られるようになった事前訓練モデル(pre-trained model)の一つであるBERTを用いて分類精度を改善した。さらにこのBERTモデルを使って、生成AI (GPT-2)が書いたテキストと人間が書いたテキストを見分ける実験を行った。GPT-2は昨今話題のChatGPTなどと比べて小規模で、自然な文章を生成する能力では劣るが、それでも条件によっては3割程度のテキストが人間と区別がつかないという興味深い結果を得た。昨今、生成AIをどのように活用できるか(あるいは規制すべきか)については様々な議論がなされているが、やがてAIと人間は区別できなくなるという前提で考えるべきである。データセットについては引き続き日本語の青空文庫データセットを用いた他に、楽天技術研究所から公開されている楽天市場および楽天トラベルデータセットを活用した。前記実験を前倒しで行ったため、ニューラルネットワークから得られる分散表現の分析については目立った進捗はないが、実験環境の構築を始めており次年度に本格的な検討を実施できる見込みである。他に、画像メディアを絡めたマルチモーダルな(いわゆるVision and Language)モデルについても若干検討を行うことができた。一連の実験の効率化のために、NVIDIA RTX A6000を2基搭載したGPUサーバ1台を導入した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ニューラルネットワークモデルの構築と改良、計算機導入による研究環境の整備など、大向け計画通りに進んでいる。
|
今後の研究の推進方策 |
当初の計画によれば、テキストを自動生成するニューラルネットワークと人間とを見分ける実験を行い、なりすましなどの不正行為を防ぐための方策を検討することになっている。ChatGPTに代表される生成AIが正負両面で注目を集めている昨今、本研究は重要なトピックを扱っている。すでに生成AIと人間を見分ける実験を始めていることは先述したが、この検討をより実際的な大規模基盤モデルで試行して、生成AIの利用法について何らかの指針を与えたい。また、生成AIに関しては画像メディアを絡めたVision and Languageモデルにも注目が集まっているが、それに関する検討も(本研究の主題ではないが関連するトピックとして)続けたいと考えている。
|