NISQ時代の実用的な量子機械学習アルゴリズムの構築

研究課題

研究課題/領域番号	23K19954
研究種目	研究活動スタート支援
配分区分	基金
審査区分	1001:情報科学、情報工学およびその関連分野
研究機関	東京大学
研究代表者	河瀬良亮東京大学, 大学院情報理工学系研究科, 助教 (50985299)
研究期間 (年度)	2023-08-31 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	1,690千円 (直接経費: 1,300千円、間接経費: 390千円) 2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
キーワード	量子機械学習 / 分散量子機械学習 / 分散量子ニューラルネットワーク / 量子コンピュータ / 量子ニューラルネットワーク / NISQ
研究開始時の研究の概要	量子ニューラルネットワークは量子機械学習においてよく用いられる手法である。その表現能力は量子回路の深さが深いほど向上するが、一方で勾配が消失してパラメータの最適化が困難になる問題がある。さらに、実際の量子デバイスではノイズがあるために、量子回路の深さが制限されたり、勾配が消失したりする。本研究では、同じパラメータを共有した量子ニューラルネットワークの層を、その層の入力と出力が等しくなるまで繰り返すモデルを提案する。このモデルは実機では1層のみを実装すればよいため、現在のノイズのある量子デバイスでも機械学習タスクを高精度に実行できることが期待される。
研究実績の概要	今年度は、「予定していた提案手法の実装」と「ベースラインとなる手法の開発とその論文化」の二つを行った。まず先行研究に基づいて深層学習の代わりに量子回路を用いることで、入力と出力が等しくなるまで、量子回路の出力をもう一度その量子回路に入力し、最後に得た出力を用いてクラス分類するコードを実装した。しかしながら、28x28サイズの手書きの数字の認識タスクを行おうとしたが、メモリ不足のため実行が困難であった。量子回路のシミュレーションでは、量子ビット数に対して指数的に必要なメモリが増加することと、量子ビット数の増加とともに勾配が消失しやすくなるため、量子ビット数を減らすアプローチが有効である。そこで特徴量を分割して量子回路に入力することで、使用する量子ビット数を減らした。具体的には、データを2行(2x28)ずつに分割し、これを各々14個の量子回路に入力した。その結果として得られる出力を用いてクラス分類することで、MNISTのデータを28x28のすべての特徴量を用いて60000個のデータで訓練して、テストデータで96%を超える正答率で10クラス分類することに成功した。これは、今までの研究では主に数字の0と1だけを識別する二値分類かつ、PCAで10次元以下に次元削減したデータでしか研究されていなかったため、非常に大きな進展である。また本研究では、分割数の増加に対してlossや精度の変化についても調査した。その結果、分割した特徴量のサイズは大きすぎても小さすぎても精度が悪くなることが示唆された。この研究成果はすでに当該研究分野でよく読まれる雑誌であるQuantum Machine Intelligence (IF: 4.8)にて査読を経て公開されている。この手法はベースラインとして採用し、当初予定していた提案手法と精度を比較する予定である。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由研究実績の概要にも記載した通り、当初予定していた先行研究に基づいて、深層学習の代わりに量子回路を用いて、その入力と出力が等しくなるまで量子回路の出力を入力したモデルを実装した。またメモリ不足に対処するために、特徴量を分割して複数の量子回路に入力するアプローチを採用し、その論文がすでに査読され公開されているため、順調に進展しているといえる。
今後の研究の推進方策	現在の問題であるメモリ不足に対処するための方法と、さらに予測精度を向上させるための方法を試す予定である。まずメモリ不足に対処するための方法として、前処理にプーリングを用いることで、特徴量数を削減することが考えられる。また勾配累積を用いることで、ミニバッチのサイズが小さくてもより正確に勾配推定が可能になる。これらの方法と特徴量を分割する方法を組合わせることで、当初予定していたモデルでも訓練が容易になることが予想される。一方で、MNIST では予測精度の向上が確認しづらい可能性があるため、より現実的なデータセットであるCifar10を用いることが考えられる。このデータセットに対しては、単純にデータを分割して複数の量子回路に入力するアプローチでは、52%程度の正答率であった。この結果をさらに向上させるために考えられるアプローチとして、たとえば位置エンコーディングを用いることで分割した特徴量に位置情報を付与することや、分割した特徴量を埋め込んだ量子状態同士の内積を用いて類似度を評価して、その類似度の重みに従って各量子回路の出力を加算することが考えられる。これらのアプローチも併用しながら、当初予定していたモデルでMNISTやCifar10のクラス分類を高精度に行うことを目指す。