2017 Fiscal Year Annual Research Report
Single-Molecule Sequencing Methods via Tunneling Current
Project/Area Number |
26220603
|
Research Institution | Osaka University |
Principal Investigator |
谷口 正輝 大阪大学, 産業科学研究所, 教授 (40362628)
|
Project Period (FY) |
2014-05-30 – 2019-03-31
|
Keywords | 1分子シークエンシング / ペプチド / 1分子科学 / トンネル電流 / ナノギャップ電極 |
Outline of Annual Research Achievements |
昨年度、1塩基分子のトンネル電流―時間波形を、機械学習を用いて解析することで、極めて高い1分子識別精度が得られることを見出した。この実験では、1塩基分子のみが溶解した水溶液を用いて測定を行い、波形を特徴量ベクトルで識別する方法を用いた。DNAとRNAの1本鎖では、パイ電子系である塩基分子が、電気伝導性が極めて低い糖とリン酸基で区切られているが、塩基分子の面間距離が近くなると、再隣接の塩基分子との電子的な相互作用がトンネル電流に影響すると予測される。本年度は、塩基分子間の電子的な相互作用を調べるため、2塩基分子からなる16種類のオリゴマーのトンネル電流―時間波形を計測し、機械学習を用いてオリゴマー内の2塩基分子の識別を行った。全てのオリゴマーが高い精度で識別され、オリゴマーを構成する塩基分子の1分子電気伝導度が、1塩基分子の1分子電気伝導度と同じであることを明らかにした。オリゴマーの電子状態を量子化学計算により検討したところ、オリゴマーのフロンティア軌道付近の分子軌道がどちらかの1塩基分子に局在し、異種塩基分子間のフロンティア軌道間の相互作用は極めて小さいことが分かった。この結果は、4つの塩基分子と電極との相互作用の大きさが同程度であると仮定すると、オリゴマーにおける塩基分子の1分子電気伝導度が、1塩基分子の1分子電気伝導度と同じである実験結果を支持している。また、1つのオリゴマー内において、リン酸基で終端される5’末端と糖で終端される3’末端の識別可能性が示唆された。 さらに、21塩基から構成される1本鎖DNAと、2つのチミンがトリフルリジンで置換された1本鎖DNAのトンネル電流―時間波形を計測し、部分塩基配列をアセンブルすることで全塩基配列決定を行った。1本鎖DNA中のチミンとトリフルリジンが、明確に識別さされることを明らかにした。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
DNAとRNA上における隣接塩基分子間相互作用の解明は、1分子シークエンシング法の学理を確立する上で必須であり、塩基配列決定の精度向上を行う上でも極めて重要となる。本年度実施したオリゴマーのトンネル電流―時間計測と機械学習による解析、およびオリゴマーの量子化学計算から、オリゴマー内では、異種塩基分子間の相互作用は極めて弱いことを見出すことができ、1分子シークエンシング法の学理構築が大きく前進した。DNAとRNAの末端部分は、-1価の電荷を持つリン酸基で終端される5’末端と、中性の糖で終端される3’末端の2つが存在する。両末端の物理化学的な主たる違いは電荷の有無であり、両末端の識別は―1価の電荷の識別を意味する。一方、DNAポリメラーゼが5′末端から3’末端の方向に働き、3’末端の方向にDNAとRNAが伸長するため、両末端の識別は、生物的にも極めて重要である。トンネル電流―時間波形の機械学習解析により、1塩基分子の高精度識別を実現し、1分子シークエンシング法の最大の課題を克服できたが、物理化学的にも生物的にも重要な両末端の識別は、機械学習を用いても極めて困難であると予測していた。しかし、塩基分子間相互作用の1分子電気伝導度への影響を調べるために行ったオリゴマーのトンネル電流―時間波形の研究において、5’末端と3’末端の識別の可能性を発見したのは想定外の結果であった。両末端の物理化学的な大きな違いは電荷であり、わずか―1価の電荷を識別できることを実証することは、1分子シークエンシング法が、DNAとRNAの塩基配列決定やペプチドのアミノ酸配配列決定のみならず、電荷の異なる1分子を識別する方法への展開が期待される。
|
Strategy for Future Research Activity |
2塩基分子からなるオリゴマーの電流―時間波形の機械学習による解析から、1分子内の3’端と5’末端の識別の可能性が見えてきた。電流―時間波形の情報量を増加させて、機械学習による両末端の高精度識別を実現するため、電流計測の時間分解能を10KHzから100KHzまで向上させた計測システムを開発する。一般的に、機械学習の特徴量の物理・化学的な解釈は極めて困難であるが、オリゴマーの量子化学計算とそれに基づく1分子電気伝導度シミュレーションから、高い精度を与える特徴量の物理・化学的な解釈を試み、識別要因の解明に取り組む。 初年度、20種類のアミノ酸の内、12種類のアミノ酸、1種類の修飾アミノ酸の1分子識別、および10残基からなるペプチドの部分アミノ酸配列決定に成功した。この実験では、識別が困難であった8種類のアミノ酸でも、電流―時間波形が得られていたが、計測システムのノイズが大きく、機械学習による解析が行われていなかった。最終年度は、これまで開発してきた低ノイズ計測システムと機械学習による解析を用いて、20種類のアミノ酸の電流―時間波形を計測し、全種類のアミノ酸の高精度な1分子識別を行う。高い識別精度が得られない場合には、本年度開発する高時間分解能電流計測システムを用いて計測を行い、高精度な1分子識別を実現する。また、電流―時間波形の出現頻度とアミノ酸の等電点の相関性の発見を基に、pHを変えてアミノ酸の高精度な1分子識別を行い、これまで得られた知識の深化を図る。塩基分子と同様に、量子化学計算と1分子電気伝導度シミュレーションを用いて、高い精度を与える特徴量の物理・化学的な解釈に取り組む。さらに、10残基からなるペプチドの全アミノ酸配列決定を実現し、1分子ペプチドシークエンシング法を完成させる。
|
Research Products
(26 results)