2019 Fiscal Year Research-status Report
複雑な形質の遺伝的背景の解明に向けた多因子的なゲノム情報処理技術の開発
Project/Area Number |
19K06629
|
Research Institution | Osaka University |
Principal Investigator |
中谷 明弘 大阪大学, 医学系研究科, 特任教授(常勤) (60301149)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | ゲノム情報 / 連鎖不平衡 / ミトコンドリア / 画像処理 / 数理モデル |
Outline of Annual Research Achievements |
検体群のゲノムDNA配列をスキャンしながら連鎖不平衡ブロック(LDブロック)を抽出する手法の開発を進めた。変異位置とそれらの間の連鎖不平衡の程度をそれぞれノードとエッジとしたネットワークを構成してグラフ理論に基づくアルゴリズムを開発し、VCFファイルやタブ区切り形式データを入力とするソフトウェアとして実装した。そこでは、検体群内でDNA配列の変異のパタンが連続して類似した染色体領域をギャップ(連鎖不平衡が途切れる領域)を許容しながらブロック化して抽出できる。同一のLDブロックに含める変異位置間の連鎖不平衡の程度や許容するギャップのサイズは指定できるようになっている。C++言語で実装することによって高速なデータ処理が可能となっている。約500検体を想定した処理では、典型的なパラメータの設定時に全染色体をカバーする約80万の変異位置から約6万のLDブロックが約15分の計算時間で抽出できた(AMD Ryzen Threadripper 2990WX上での並行処理)。問題サイズ(変異位置数)に対して線形時間の時間複雑度が想定できることを実測によって確認した。抽出したLDブロックを可視化する手法の開発を進めた。そこでは、LDブロック間の関係や複数系統のLDブロックを分離した結果や検体間の変異パタンの類似関係などを描画できる。併せて、関連する手法の特許化に向けた作業も進めた。ゲノム情報と形質情報の相互関係を学習に基づいてモデル化する手法の開発も進めた。DNAシーケンサ出力の解析パイプラインで付与される注釈情報や検体群内での変異頻度およびゲノムワイド関連解析(GWAS)による有意さに基づいて選択した変異位置での変異パタンから特定の形質の表現型を推定することができる(ゲノミックプレディクション)。そこでは、遺伝要因に加えてさまざまな環境要因や遺伝要因と環境要因の交互作用も設定することが可能となっている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「ゲノムDNA配列からの連鎖不平衡ブロックの構造化手法の開発」での開発項目(連鎖不平衡ブロックの抽出手法)および「ゲノム情報と形質情報の相互関係の定式化手法の開発」での開発項目(多因子的な数理モデルの構築手法)は初期版が完成するに至っている。「ミトコンドリア電子顕微鏡画像からの形状形質の定量化手法の開発」での開発項目(ミトコンドリアの形状特徴量の定量手法と画像データベース)は引き続き開発を行っている。
|
Strategy for Future Research Activity |
「ミトコンドリア電子顕微鏡画像からの形状特徴量の定量手法」の開発と「形質情報の定量化機能を備えたミトコンドリア画像データベース」の開発を進める。今年度までに開発した連鎖不平衡ブロックの抽出手法と多因子的な数理モデルの構築手法と連携する仕組みの構築も進める。
|
Causes of Carryover |
データベース構築用サーバーの機能を開発/解析用PC上で仮運用することとしたために次年度使用額が生じた。当該サーバーは次年度以降に開発内容により合致した仕様で整備する。
|