2017 Fiscal Year Annual Research Report
Crop Cultivation Process Deciphered by Large-Scale Genome Sequence Analysis
Project/Area Number |
15K07175
|
Research Institution | National Agriculture and Food Research Organization |
Principal Investigator |
伊藤 剛 国立研究開発法人農業・食品産業技術総合研究機構, 高度解析センター, チーム長 (80356469)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 塩基置換推定 / 負の二項分布 / ポワソン分布 / ガンマ分布 |
Outline of Annual Research Achievements |
種間もしくは集団間の塩基置換は、座位間に置換速度の差がなければポワソン分布に従うはずである。しかし実際には、自然選択その他の要因により、座位ごとに置換速度の差があり、これがガンマ分布に従うと仮定するとポワソン分布より分散が大きい負の二項分布(ポワソン-ガンマ分布)になるはずである。負の二項分布の平均の期待値はデータ全体の平均値と一致し、これは最尤推定値でもある。また、分散は期待値と形状母数(gamma parameter)から計算され、データから期待値と分散を得た場合はこれらから逆に形状母数を推定できる。例えばイネにおいてアジア栽培稲とアフリカイネの間の置換数の分布を作成し、ポワソン分布と比較すると大きくずれる。ここで負の二項分布を仮定して比較すると、ポワソン分布よりはるかによく実データと一致することが分かった。ただ、祖先多型を考慮して、種分岐による部分と祖先の種内多様性による部分を分離した場合、更によく実データと合致するので、二者から択一の場合はこちらの方がよい。この後者に負の二項分布を導入すると数式が大変複雑になり、今のところ導入には成功していない。研究データを蓄積、公開するサーバーについては、セットアップはしたものの構築が遅れており、公開には至っていない。特に、昨今は公開用サーバーを作成する際にセキュリティ対策を入念に行う必要があり、かなりの労力を要する。一般に完全フリーで公開するより、興味を持っている研究者に限定してデータ共有する方がよいのではないかと考えている。
|