Error Correcting Constrained Codes for DNA Storage and Their Evaluations
Project/Area Number |
23K10983
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60010:Theory of informatics-related
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
眞田 亜紀子 長岡技術科学大学, 工学研究科, 准教授 (20631138)
|
Co-Investigator(Kenkyū-buntansha) |
太田 隆博 専修大学, ネットワーク情報学部, 教授 (60579001)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2025: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | DNAストレージ / 制約符号 / 誤り訂正符号 / Charge制約 / 最大連長制約 / PFT / 最大符号化率 / データ圧縮 |
Outline of Research at the Start |
DNA(デオキシリボ核酸)ストレージは,高密度かつ長寿命な次世代ストレージとして昨今注目されている.本研究では,DNAストレージの実用化に向けて,高信頼性と効率性の観点から適した符号化の提案と評価に取り組む.まず,高信頼性の観点では,誤り訂正と系列制約を兼ね備えた符号を提案し,長期間保存しても正しくデータが読み取れるようにする.効率性の観点では,インデックスレスとデータハイディングの観点からデータ圧縮を予め行うことで,データ保存に必要なDNA鎖を極力削減し,コスト削減に貢献する.
|
Outline of Annual Research Achievements |
近年,新たな記録媒体として高密度かつ長寿命であるDNAストレージが注目を集めている.DNAストレージにデータを保存する際には,データを安定して保存するために,DNA鎖(保存するDNA記号列)はk-最大連長制約(同じ塩基を連続して高々k個までしか並べられない制約)とGCバランス制約(DNA鎖中のグアニンとシトシンの割合を50%にする制約)を同時に満たす必要がある.一方で,突然変異や交叉などの誤りに対する訂正能力も保持しなければならない.これらの問題に対して,2023年度はCharge制約とPeriodic-Finite-Type shift (PFT) に主として着目し,それらをDNAストレージに応用した際の有用性について理論的に考察した. B-Charge制約とは,バイポーラ系列(+1と-1からなる系列)における任意の部分系列の和を-Bから+Bに指定する制約であり,DNA鎖におけるアデニンとシトシンを+1,グアニンとシトシンを-1と置き換えることで,GCバランス制約と似た制約を考えることができる.また,(GCバランス制約と異なり)Charge制約はラベル付き有向グラフで制約を満たす系列を表現できる.このグラフ表現を用いることで,最大符号化率に関する近似値を求めることができた. PFTは系列の並びに関する制約と誤り訂正能力を兼ね備える符号化を提案する際に有効であり,PFTに関する最大符号化率を求めることで,提案手法の良さを符号化率の観点から比較することができる.最大符号化率は一般的にグラフ表現を用いて計算するが,本研究においては,禁止語の長さkと個数,及び周期Tを用いて,kがT以下の際に,最大符号化率をclosed formで与えた.また,系列の並びに関する制約と誤り訂正能力を兼ね備える符号化として,パリティ挿入法を用いた手法も提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
DNAストレージに適した符号を提案するために,Charge制約とPFTに着目し,その最大符号化率に関する解析について注力した.その結果,Charge制約を用いたGCバランス制約の最大符号化率の近似や,PFTに関する最大符号化率をclosed formで与えるなど,研究テーマに対する明確な成果が得られた.また,誤り訂正と系列制約満たす符号化方式を提案し,その性質についても調査した. これらの結果は国内研究会で発表し,多くの研究者に興味を持っていただいた.また発表後にいただいたフィードバックをもとに,今後どのように改良していくかについてのディスカッションも行えたため,非常に有意義に研究を進められたと自負する.
|
Strategy for Future Research Activity |
今後の課題として,まずPFTの最大符号化率の拡張が挙げられる.具体的には,禁止語の長さkと周期Tにおいてk>Tの場合にも最大符号化率をclosed formで表すことができる条件を見つけたい.その上で,系列の制約と誤り訂正能力をみたす符号化方式をいくつか提案し,それらの符号化率が上記で得られた最大符号化率にどれだけ近いか評価する.符号化方式としては,これまで用いたパリティ挿入方式を改良するだけでなく,Charge制約を用いた方法についても考慮し,GCバランス制約を満たすために付けられた冗長部分に誤り訂正に関する情報を組み込めないか考察する. また,データ圧縮関連として,DNA鎖の部分系列を用いて元のDNA鎖を復元できる方法についても現在検討している.特に,部分系列に誤りがあったとしてもDNA鎖を復元可能な手法について検討しており,コスト削減と信頼性の観点から有効なデータ圧縮方法を提案したいと考えている.
|
Report
(1 results)
Research Products
(6 results)