2022 Fiscal Year Annual Research Report
Discrete mathematical approach for suitable coding scheme on DNA strorage
Project/Area Number |
19K11833
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
眞田 亜紀子 長岡技術科学大学, 工学研究科, 准教授 (20631138)
|
Co-Investigator(Kenkyū-buntansha) |
太田 隆博 専修大学, ネットワーク情報学部, 教授 (60579001)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | DNAストレージ / 制約符号 / データ圧縮 / バランス制約 / 連長制約 / 最大符号化率 / グラフ理論 |
Outline of Annual Research Achievements |
本研究の目的は,長寿命かつ高密度な次世代記録媒体として注目されているDNAストレージの実用化に向けて,離散数学的観点からアプローチすることである.特に,1)DNAストレージの信頼性を担保するための「GCバランス制約(グアニンとシトシンの割合をDNA鎖全体の半分にする)」や「連長制約(それぞれの 塩基の連の長さをある値以下にする)」を満たす符号化の提案,及び2)コスト削減のためのデータ圧縮法の提案に着目して研究を行なってきた. 2022年度は,これまでの研究の総まとめとして上記1)2)に対する以下の結果をまとめた. 1)に関しては,GCバランス制約と連長制約を同時に満たすDNA鎖に符号化する際の最大符号化率が,連長制約のみを満たした場合と一致することを示した.連長制約を満たした場合の研究は詳細に行われているため,既存結果を用いてGCバランス制約も考慮した場合まで容易に拡張できるのではと自負している.また,これまでは各塩基の連長制約は同じと仮定していたが,塩基ごとに連長制約を変えた場合の最大符号化率を求める式も導出した. 2)に関しては,2021年度に提唱した「部分系列とその頻度(データ系列に出現する回数)及び禁止語(データ系列に現れない系列)を頂点としたグラフ」のさらなる解析を行なった.頂点を訪れるごとにその頂点の頻度を1減らす操作を行う場合,全ての頂点の頻度がちょうど0になる一筆書きが一意に可能であるための十分条件を提示していたが,その条件を必要十分条件にまで拡張した.つまり,「データ系列を復元する際に必要な系列の長さをできるだけ短くしたい」という観点から部分系列と禁止語を用いたデータ圧縮を用いる際の必要十分条件を明確にしたことになる. これらの研究成果は,国際会議や国内会議での発表を行いコメントをいただいた.また,いただいたコメントをもとに結果を洗練し論文にまとめた.
|
Research Products
(4 results)