2018 Fiscal Year Research-status Report
Establishing genome-wide analysis of RNA guanine quadruplexes conserved among species
Project/Area Number |
18K11526
|
Research Institution | Osaka University |
Principal Investigator |
加藤 有己 大阪大学, 医学系研究科, 助教 (10511280)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | RNA / G4重鎖 / トランスクリプトーム |
Outline of Annual Research Achievements |
近年の網羅的解析により、細胞内に発現するRNAの大多数がタンパク質をコードしない非コードRNA (ncRNA) であることが明らかとなった。G4重鎖は核酸中のグアニンに富んだ配列に形成される特殊な高次構造であり、ncRNA中に豊富に存在している可能性が指摘されている。しかし、生物学的意義や異なる種間での保存性、そのゲノム全体での規模など未解明な部分が多い。本研究では、比較構造情報解析を行うことで、従来見過ごされてきたncRNA中の種間で保存されたG4重鎖領域をゲノムワイドに同定することを目的とする。具体的に、G4重鎖候補領域を深層学習により予測した後、種間での比較配列解析を行う。 今年度は、本研究で中心的な役割を果たすG4重鎖の予測器の開発に注力した。ここでは、畳み込みニューラルネットワークや再帰型ニューラルネットワークを用いて予測器を構成し、訓練データおよびテストデータを用いて性能評価を行った。両者とも類似した精度を確認したが、モデルの学習という観点からは畳み込みニューラルネットワークの方が扱いやすいため、後にモデルをこちらに固定し、層数などのハイパーパラメータの調節をベイズ最適化により行った。なお、性能評価を繰り返し実施した結果、今回利用した訓練データとテストデータの分布の相違が原因で、訓練データのホールドアウト検証では正解率が非常に高い(95%以上)ものの、テストデータにおける識別能力があまり上がらないことが判明した。具体的に、テストデータ上で予測結果の擬陽性率が高くなる、すなわち、実際にはG4重鎖でないものをG4重鎖と判定してしまう傾向にあった。そのため、次年度ではテストデータの生成法を大幅に変更する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
深層学習によるG4重鎖予測器の枠組み自体は確立できたため、本研究はおおむね順調に進展していると考えている。
|
Strategy for Future Research Activity |
先に述べたように、テストデータの構成法を改良する。改良法自体はすでに発案済みであるので、速やかに実装する予定である。次に、同目的の他手法との比較検討を行い、提案手法の有効性を多角的に検証する。
|
Causes of Carryover |
旅費の支出および学会参加に要する参加費等が、研究代表者の都合が合わず、一部参加を見合わせたことにより、当初の計画より少なくなり、次年度使用額が生じた。 翌年度分として請求した助成金と合わせた使用計画は以下の通りである。 物品費として、デスクトップPC、関連するソフトウェア、情報科学関連図書を計上し、研究調査、打ち合わせ、成果発表のための旅費、その他として学会参加費および論文掲載費を計上する。
|
Research Products
(5 results)