| Project/Area Number |
24H00714
|
| Research Category |
Grant-in-Aid for Scientific Research (A)
|
| Allocation Type | Single-year Grants |
| Section | 一般 |
| Review Section |
Medium-sized Section 61:Human informatics and related fields
|
| Research Institution | The University of Electro-Communications |
Principal Investigator |
清 雄一 電気通信大学, 大学院情報理工学研究科, 教授 (20700157)
|
| Co-Investigator(Kenkyū-buntansha) |
石川 冬樹 国立情報学研究所, アーキテクチャ科学研究系, 准教授 (50455193)
松崎 和賢 中央大学, 国際情報学部, 教授 (00831794)
田原 康之 電気通信大学, 大学院情報理工学研究科, 准教授 (30390602)
大須賀 昭彦 電気通信大学, 産学官連携センター, 特任教授 (90393842)
|
| Project Period (FY) |
2024-04-01 – 2028-03-31
|
| Project Status |
Granted (Fiscal Year 2025)
|
| Budget Amount *help |
¥47,970,000 (Direct Cost: ¥36,900,000、Indirect Cost: ¥11,070,000)
Fiscal Year 2025: ¥8,580,000 (Direct Cost: ¥6,600,000、Indirect Cost: ¥1,980,000)
Fiscal Year 2024: ¥16,900,000 (Direct Cost: ¥13,000,000、Indirect Cost: ¥3,900,000)
|
| Keywords | プライバシ / 機械学習 / IoT / 生成AI |
| Outline of Research at the Start |
生成AIサービスが急速に広まっており、生成AIが偏在する社会が到来する。これまで主に一般的な教師あり学習モデル単体を対象とした閉じた世界で、訓練データや出力にノイズを加えることでプライバシ情報を暴く攻撃の精度を低下させる研究が盛んに行われてきた。生成AIも考慮され始めているが、ノイズ付与量に対するプライバシ情報の漏洩リスクについて保証することは困難である。本研究では、生成AI偏在社会の到来を踏まえた、複数の生成AIやWeb/IoTデータの組合せを考慮した上で、プライバシ情報の漏洩リスクを把握・制御する基盤を提供することを目指す。
|
| Outline of Annual Research Achievements |
生成AIサービスが急速に広まっており、生成AIが偏在する社会が到来する。これまで主に一般的な教師あり学習モデル単体を対象とした閉じた世界で、訓練データや出力にノイズを加えることでプライバシ情報を暴く攻撃の精度を低下させる研究が盛んに行われてきた。生成AIも考慮され始めているが、プライバシ情報の漏洩リスクについて保証することは困難である。 今年度は、生成AIへの入力となるデータプライバシについて、l-多様性や差分プライバシを保証した上で高精度な分析が可能となる手法を提案した。データに対して適切にノイズを加えることで個々の個人の情報は秘匿した上で、統計データや生成AIモデルへの入力に使用し、これらの精度が実用に耐えうることの確認を行った。先行研究はpoisoning攻撃やcollusion攻撃に脆弱であるという課題があったが、提案手法は精度を向上させつつ、これらの攻撃への耐性があることの確認を複数の実データに対して行った。 また、パーソナルデータを対象とした生成AIモデルの構築を行った。話し言葉や画像を入力として、ターゲットとしたタスクにおいては高精度を実現できることを確認した。 スマートシティやメタバース空間においてもプライバシ保護が課題となっており、バーチャルな世界空間も含めて、プライバシを保護した上で機械学習を行うシステムの開発を行った。 生成AIモデルのセキュリティ課題として、公平性や脱獄問題の調査や対策について検討し、新しい脱獄手法とその対策手法を考案した。
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
プライバシ保護及び生成AIの研究成果を挙げており、IEEE S&Pや複数のジャーナルにも採択されており、おおむね順調に進展していると考えられる。
|
| Strategy for Future Research Activity |
誤差・欠損のある訓練データを基に、訓練データ間の関係構築(成果2-1)と訓練データ生成モデル構築(成果2-2)をそれぞれ行う。 成果2-1: 訓練データ間の関係構築 抽象度及び精度の差異に基づき訓練データ間をリンクでつなぎ、Linked Dataを構築する。誤差及び欠損が存在するが、応募者らは、誤差についてはグラフでつながったデータに対するマイニング手法を、欠損についてはCompletion methodを提案しており、これらの手法を応用する。さらに、訓練データ間の隠れた関係性を発見する手法を利用する。 成果2-2: 訓練データ生成モデル構築 金融分野で利用されているGaussian Copulaを利用して各属性単体での訓練データ生成モデルを構築する。この生成モデルに基づき、プライバシ分野で利用されている摂動データ復元技術(応募者らも提案している、事前に指定した誤差関数に基づいて値をランダムに変化させる摂動法及び多数の摂動データを基に真のデータ分布を復元する技術)を応用して、誤差・欠損を考慮した上で、訓練データの属性間の関係性を復元する。
|