病害菌に感染したときに誘導される2つの植物ホルモンを添加し、シクロヘキサミドに湿潤させ、リボソームの翻訳を停止させた。その後、液体窒素で粉々にした植物体に存在する全RNAを分解し、リポソームに保護されているRNA断片のみを抽出した。それらのRNA断片をcDNAとしてライブリー化して、Illumina HiSEQで、リボソームに保護されていたmRNA断片を網羅的に決定した。これらのRibo-seq解析は、当該領域の公募研究班である七野班の指導の下で実施した。Ribo-seq解析で決定されたReadを遺伝子にマッピングすると、開始コドンと終止コドン付近で多くのReadが決定され、コドンにMappingされる位置も3塩基周期を持つ。我々が決定したReadは、これらの特徴を明確に有していた。Readのマッピングの際に、第1コドンにMappingされるように補正をかけ、100bp以内でマッピングされるコーディング領域を予測した。予測されたコーディング領域の内、既知遺伝子領域に存在せず、ジャスモン酸あるいはサリチル酸添加で有意に発現が上昇する1225個のコーディング領域を見出した。これらのORFの内、どのORFがタンパク質をコードするかを決定するために数理モデルの構築を行った。その際に、Li et alらの研究(Genome Research 2020)で予測されたAUGを開始コドンに持つ8115個の既知遺伝子と非AUGを開始コドンに持つ2792個の既知遺伝子の塩基組成と、Ribo-seqのRead部位によって予測される第1コドン部位を学習データとして、既知遺伝子を最も予測できる数理モデルを構築した。その数理モデルを用いて、各転写配列の中で、最も尤度の高いORFを候補遺伝子領域とした。これらのORFの中で、非AUGを開始コドンに持つ54個の遺伝子領域を見出すことに成功している。
|