2023 Fiscal Year Research-status Report
Project/Area Number |
23K18462
|
Research Institution | Kyoto University |
Principal Investigator |
佐藤 高史 京都大学, 情報学研究科, 教授 (20431992)
|
Project Period (FY) |
2023-06-30 – 2026-03-31
|
Keywords | DNA記憶装置 / コールドデータ / 類似画像検索 |
Outline of Annual Research Achievements |
デオキシリボ核酸(DNA)は、記録密度や長期保存性の観点で、記憶媒体としての優れた特徴を備えている。そのため、アクセス頻度が低いがデータ量が多く長期保存が求められる、いわゆる「コールドデータ」を保存する媒体としての活用に向けて、その信頼性や利便性の向上が図られている。DNA記憶装置を活用するうえでは、単純な記憶媒体として用いるだけでなく、それが将来的に保持するであろう極めて巨大なデータを既存媒体上に展開することなく、DNAのままで高機能な演算ができることが望ましい。 ハードディスクや磁気テープと比較して、DNAの書き込み(合成)やその整列を伴う読み出し(シークエンシング)は誤り率が高いことから、データの読み書きの信頼性を高める研究が盛んに行われている。本研究では、DNA記憶装置を実用的に用いる上で信頼性向上の次のステップとして求められる、DNAの持つ高い並列性を活かして検索等の情報処理機能の実現を目指している。 今年度はまず、DNA記憶装置の原理や、そこで用いられる様々なアルゴリズムについて調査を行った。調査の結果、DNA記憶装置を用いる検索機能が応用の広さと実現性の両面で有望であり、特に、DNA記憶装置内に蓄えられている多数の画像に対し、検索クエリ画像に対応するDNA単鎖を混合することで、クエリと類似する画像をハイブリダイゼーションを通じて取得する高並列な画像検索機能の実現方法について検討を行った。その結果、DNAへのエンコーディング処理が、全体の中で大きな計算負荷を占めていることをシミュレータにより確認した。また、エンコーダの負荷を軽減する手法を考案し、そのプロトタイプソフトウェアを作成した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究においてDNA記憶装置に与える重要な機能の一つとして、検索機能がある。検索機能、特に大規模な画像データベースに対する効率の良い検索は、多くの応用を持つ重要な処理である。今年度は、文献調査に基づいて類似画像検索に目的を絞り、多数の画像の中から検索クエリ画像と似た画像を選び、取り出す操作を実現するための、塩基をシンボルとする符号化(エンコーディング)方法について検討を行った。また、DNAを用いて検索した類似画像が人間の目から見て似ているか否かを判定する、類似画像の適切性を評価する手法が提案されていなかった。このため、類似画像の検索能力を、あらかじめラベルが与えられているクラス分類課題を通じて評価する方法を合わせて提案した。提案した解決策は、DNA間のハイブリダイゼーションを計算機上で模擬するシミュレーションを通じて評価した。 これらのDNA記憶装置に用いられている技術調査や課題の洗い出し、および、課題に対する解決策の提案と評価は、当初の計画に概ね沿ったものとなっている。
|
Strategy for Future Research Activity |
今年度実施した調査で明らかとなった最大の課題は、DNAを用いて類似画像を検索する際に、従来研究では二種類のエンコーダを用いていることである。すなわち、画像それ自身の特徴を表す画像特徴量の抽出を行うエンコーダと、検索クエリとして実現するために抽出した画像特徴量を単鎖DNAの配列に変換するDNA配列のエンコーダである。前者のエンコーダは、類似画像が似た特徴量を出力し異なる画像は異なる特徴量を出力すること、後者のエンコーダは、似た特徴量がハイブリダイゼーションし易く異なる特徴量はハイブリダイゼーションが起こりにくいようシンボルを割り当てること、が目的となっている。 シミュレータも併用してこの手続きを確認する過程で、従来研究においては、これらのエンコーダはいずれも計算量が大きく、計算時間の大部分を占めていることが判明している。今年度の研究により、これらのエンコーダを、より高速に実行でき、またDNAでの実現に適するものに置き換える着想を得て、プロトタイプを作成している。まずは、プロトタイプの評価(エンコーダの実行時間や類似画像検索としての精度等)をより詳細に行い、DNAを用いる高精度かつ高速な画像検索を目指す予定である。
|
Causes of Carryover |
本年度は研究を早期に立ち上げるため、DNA記憶装置全般に関する調査を集中的に行った。特に、記憶媒体としてのDNAの合成方法や保管方法、実際に検索等を行う場合に保管している情報が失われないための方法など、DNAを用いて実用的な高機能演算を実現するために必要となる基礎事項が多岐にわたっており、その調査に予想以上の時間を要した。一方で、これらの調査の過程で、シミュレータの活用が有効であることがわかった。シミュレータを積極的に活用することで、DNA鎖の合成等を実際に行うことなく、検討するアイデアの実現性をある程度正確に予測できる。このため、シミュレータを用いる検討を行うことで研究を加速し、費用の節約を図っている。 次年度以降、研究の進展に従って、特に有望と考えられるアイデアについては実験等により有効性を実証する必要があると考える。その際に、当初予定していた物品を購入する計画としている。また、シミュレーションを用いて検討した結果については、国際会議へ論文として投稿し採録が決まっていることから、未使用額は旅費としても執行する予定である。
|
Remarks |
集積システム工学講座のwebページに、本研究課題を含む発表成果を随時掲載している。 https://vlsi.cce.i.kyoto-u.ac.jp/
|