2023 Fiscal Year Research-status Report
Error Correcting Constrained Codes for DNA Storage and Their Evaluations
Project/Area Number |
23K10983
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
眞田 亜紀子 長岡技術科学大学, 工学研究科, 准教授 (20631138)
|
Co-Investigator(Kenkyū-buntansha) |
太田 隆博 専修大学, ネットワーク情報学部, 教授 (60579001)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | DNAストレージ / 制約符号 / 誤り訂正符号 / Charge制約 / 最大連長制約 / PFT / 最大符号化率 |
Outline of Annual Research Achievements |
近年,新たな記録媒体として高密度かつ長寿命であるDNAストレージが注目を集めている.DNAストレージにデータを保存する際には,データを安定して保存するために,DNA鎖(保存するDNA記号列)はk-最大連長制約(同じ塩基を連続して高々k個までしか並べられない制約)とGCバランス制約(DNA鎖中のグアニンとシトシンの割合を50%にする制約)を同時に満たす必要がある.一方で,突然変異や交叉などの誤りに対する訂正能力も保持しなければならない.これらの問題に対して,2023年度はCharge制約とPeriodic-Finite-Type shift (PFT) に主として着目し,それらをDNAストレージに応用した際の有用性について理論的に考察した. B-Charge制約とは,バイポーラ系列(+1と-1からなる系列)における任意の部分系列の和を-Bから+Bに指定する制約であり,DNA鎖におけるアデニンとシトシンを+1,グアニンとシトシンを-1と置き換えることで,GCバランス制約と似た制約を考えることができる.また,(GCバランス制約と異なり)Charge制約はラベル付き有向グラフで制約を満たす系列を表現できる.このグラフ表現を用いることで,最大符号化率に関する近似値を求めることができた. PFTは系列の並びに関する制約と誤り訂正能力を兼ね備える符号化を提案する際に有効であり,PFTに関する最大符号化率を求めることで,提案手法の良さを符号化率の観点から比較することができる.最大符号化率は一般的にグラフ表現を用いて計算するが,本研究においては,禁止語の長さkと個数,及び周期Tを用いて,kがT以下の際に,最大符号化率をclosed formで与えた.また,系列の並びに関する制約と誤り訂正能力を兼ね備える符号化として,パリティ挿入法を用いた手法も提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
DNAストレージに適した符号を提案するために,Charge制約とPFTに着目し,その最大符号化率に関する解析について注力した.その結果,Charge制約を用いたGCバランス制約の最大符号化率の近似や,PFTに関する最大符号化率をclosed formで与えるなど,研究テーマに対する明確な成果が得られた.また,誤り訂正と系列制約満たす符号化方式を提案し,その性質についても調査した. これらの結果は国内研究会で発表し,多くの研究者に興味を持っていただいた.また発表後にいただいたフィードバックをもとに,今後どのように改良していくかについてのディスカッションも行えたため,非常に有意義に研究を進められたと自負する.
|
Strategy for Future Research Activity |
今後の課題として,まずPFTの最大符号化率の拡張が挙げられる.具体的には,禁止語の長さkと周期Tにおいてk>Tの場合にも最大符号化率をclosed formで表すことができる条件を見つけたい.その上で,系列の制約と誤り訂正能力をみたす符号化方式をいくつか提案し,それらの符号化率が上記で得られた最大符号化率にどれだけ近いか評価する.符号化方式としては,これまで用いたパリティ挿入方式を改良するだけでなく,Charge制約を用いた方法についても考慮し,GCバランス制約を満たすために付けられた冗長部分に誤り訂正に関する情報を組み込めないか考察する. また,データ圧縮関連として,DNA鎖の部分系列を用いて元のDNA鎖を復元できる方法についても現在検討している.特に,部分系列に誤りがあったとしてもDNA鎖を復元可能な手法について検討しており,コスト削減と信頼性の観点から有効なデータ圧縮方法を提案したいと考えている.
|
Causes of Carryover |
2023年度は順調に研究を進めることができた.実際,これまで投資してきた設備環境のおかげで,新たな機器を設置する必要なく順調に研究成果をあげることができた.そのために予想よりも少ない金額におさめることができたが,今後はこれまで以上に学生との共同研究を発表する機会が増えると期待される.積極的に学会発表を行い,世界に向けて研究成果を発信していきたい.
|