2022 Fiscal Year Research-status Report
Project/Area Number |
21K11967
|
Research Institution | Yokohama City University |
Principal Investigator |
越仲 孝文 横浜市立大学, データサイエンス学部, 教授 (60895928)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 深層学習 / ニューラルネットワーク / 自然言語処理 / 生体認証 / 生成AI |
Outline of Annual Research Achievements |
本研究では、音声に含まれる個人性のうち、これまであまり研究されてこなかった言語的な個人性、すなわちテキスト情報に現れる書き手の特徴について明らかにする。研究成果は、音声通話やネット投稿のなりすましのような犯罪の防止、さらには近年著しい進歩を見せている生成AIの悪用防止に有用である。 当年度は、深層ニューラルネットワークに基づくテキスト分類モデルを構築し、その精度向上を図った。とりわけ、近年その有効性が広く知られるようになった事前訓練モデル(pre-trained model)の一つであるBERTを用いて分類精度を改善した。さらにこのBERTモデルを使って、生成AI (GPT-2)が書いたテキストと人間が書いたテキストを見分ける実験を行った。GPT-2は昨今話題のChatGPTなどと比べて小規模で、自然な文章を生成する能力では劣るが、それでも条件によっては3割程度のテキストが人間と区別がつかないという興味深い結果を得た。昨今、生成AIをどのように活用できるか(あるいは規制すべきか)については様々な議論がなされているが、やがてAIと人間は区別できなくなるという前提で考えるべきである。データセットについては引き続き日本語の青空文庫データセットを用いた他に、楽天技術研究所から公開されている楽天市場および楽天トラベルデータセットを活用した。前記実験を前倒しで行ったため、ニューラルネットワークから得られる分散表現の分析については目立った進捗はないが、実験環境の構築を始めており次年度に本格的な検討を実施できる見込みである。他に、画像メディアを絡めたマルチモーダルな(いわゆるVision and Language)モデルについても若干検討を行うことができた。一連の実験の効率化のために、NVIDIA RTX A6000を2基搭載したGPUサーバ1台を導入した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ニューラルネットワークモデルの構築と改良、計算機導入による研究環境の整備など、大向け計画通りに進んでいる。
|
Strategy for Future Research Activity |
当初の計画によれば、テキストを自動生成するニューラルネットワークと人間とを見分ける実験を行い、なりすましなどの不正行為を防ぐための方策を検討することになっている。ChatGPTに代表される生成AIが正負両面で注目を集めている昨今、本研究は重要なトピックを扱っている。すでに生成AIと人間を見分ける実験を始めていることは先述したが、この検討をより実際的な大規模基盤モデルで試行して、生成AIの利用法について何らかの指針を与えたい。また、生成AIに関しては画像メディアを絡めたVision and Languageモデルにも注目が集まっているが、それに関する検討も(本研究の主題ではないが関連するトピックとして)続けたいと考えている。
|
Causes of Carryover |
参加予定だった国際会議がオンライン開催となり、旅費を使用しなかったため。次年度の研究環境改善のため有効活用したい(GPUサーバや無停電電源装置などの増強)。
|
Research Products
(2 results)